KMeans++是怎么选初始点的?

  统计/机器学习 无监督学习    浏览次数:3563        分享
1

KMeans++是Kmeans的改进,改进的地方主要是在选初始点,但是没有搞明白到底是怎么选初始点的?

谢谢!

 

John雄   2019-09-04 07:40



   1个回答 
8

根据Kmeans++

先随机选一点作为$C_1$;

$D(x_i)=|x_i-C_1|^2$, $D(x_i)$越大,有更大概率被选为下一个中心点$C_2$;

$D(x_i)=min({|x_i-C_k|^2}), k=1,2$,$D(x_i)$越大,有更大概率被选为下一个中心点$C_3$;

...

直到选出$C_K$。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2019-09-05 00:24



  相关讨论

关于小批量K均值(mini-batch K Means)的问题

k-medoids和k-means区别

通俗地解释c-means以及fuzzy c-means是什么意思

kernal kmeans是什么意思?和一般的kmeans的区别是什么?

Jenks和K Means在一维数据时,是不是等价的?

K-Means实现mini-batch online learning的原理是什么?

kmeans可以做并行化计算达到加速效果吗?

K-MEANS初始点选择的问题

K Means初始点必须是样本中的点吗

关于online KMeans步骤中成员更新分类的问题?

  随便看看

logloss的取值范围是多少?一般好的分类器能达到多少?

如果样本不是正态分布,还能用t-test或者z-test吗?

tf.placeholder(tf.float32, shape=(None, 1024))中的None是什么意思

pandas读取csv中指定的某些列

Pandas怎样对dataframe中的一个时间列进行排序?