KMeans++是Kmeans的改进,改进的地方主要是在选初始点,但是没有搞明白到底是怎么选初始点的?
谢谢!
1个回答
根据Kmeans++
先随机选一点作为$C_1$;
$D(x_i)=|x_i-C_1|^2$, $D(x_i)$越大,有更大概率被选为下一个中心点$C_2$;
$D(x_i)=min({|x_i-C_k|^2}), k=1,2$,$D(x_i)$越大,有更大概率被选为下一个中心点$C_3$;
...
直到选出$C_K$。
SofaSofa数据科学社区DS面试题库 DS面经KMeans++是Kmeans的改进,改进的地方主要是在选初始点,但是没有搞明白到底是怎么选初始点的?
谢谢!
根据Kmeans++
先随机选一点作为$C_1$;
$D(x_i)=|x_i-C_1|^2$, $D(x_i)$越大,有更大概率被选为下一个中心点$C_2$;
$D(x_i)=min({|x_i-C_k|^2}), k=1,2$,$D(x_i)$越大,有更大概率被选为下一个中心点$C_3$;
...
直到选出$C_K$。
SofaSofa数据科学社区DS面试题库 DS面经