K-MEANS初始点选择的问题

  统计/机器学习 无监督学习    浏览次数:8564        分享
3
对于K-Means聚类算法,一开始我们要先给K个初始点,一般来说是随机地选K个点作为起始。还有更好的选择初始点的方法吗?
 

雕牌   2017-04-11 09:39



   2个回答 
6

有的。可以选相距最远的K个点作为初始点。

K-Means的目的是为了找出K个截然不同的聚类。所以我们希望这K个聚类分得越开越好。初始点分开得远更有利于算法快速收敛。


SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2017-04-15 08:29

Make sense! 好方法! - 想当小五哥   2017-04-15 10:46
3

有Kmeans++算法。

https://en.wikipedia.org/wiki/K-means%2B%2B

Matlab的Kmean默认是Kmeans++。


SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-03-15 13:36



  相关讨论

KMeans++是怎么选初始点的?

k-medoids和k-means区别

关于online KMeans步骤中成员更新分类的问题?

kmeans可以用在三维数据上吗?

K Means初始点必须是样本中的点吗

Jenks和K Means在一维数据时,是不是等价的?

kernal kmeans是什么意思?和一般的kmeans的区别是什么?

关于小批量K均值(mini-batch K Means)的问题

kmeans可以做并行化计算达到加速效果吗?

通俗地解释c-means以及fuzzy c-means是什么意思

  随便看看

推荐系统里的ALS是什么意思?

hyperparameter与parameter的区别?

matplotlib画图怎么确保横坐标和纵坐标的单位长度一致?

概率论中的鞅是什么?

什么是混淆矩阵(confusion matrix)