二分法K Means的算法是什么?和普通的K Means有什么区别?

  统计/机器学习 无监督学习 开放问题    浏览次数:7931        分享
3

二分法K Means的算法是什么?和普通的K Means有什么区别?

谢谢!


 

FTD   2017-07-18 09:59



   2个回答 
7

二分法K Means(bisecting K Means)其实可以看作是一种阶层聚类(hierarchical clustering)方法。

  1. 第一步、确定K的大小
  2. 所有点都被在一个cluster当中
  3. 对所有点进行2 Means,得到两个聚类,比如说C1,C2
  4. 对C1或者C2进行2 Means,从而又一个聚类被一分为二,此时,我们就有三个cluster,C1,C2,C3
  5. 对C1,C2或者C3其中一个clustering再进行2 Means,此时我们就有4个cluster。
  6. 反复进行,直到我们产生出K个cluster为止。

二分法K Means可以保证收敛到最优,而普通的K Means却不能。


SofaSofa数据科学社区DS面试题库 DS面经

岛歌   2017-11-29 11:47

第4步里面“对C1或者C2进行2 Means”,那到底是C1还是C2呢?怎么确定的呢? - PR   2017-11-30 10:48
C1,C2两个都试试,分别计算SSE(sum of squared errors),哪个SSE小就选哪个 - 岛歌   2017-11-30 22:52
2

二分法K Mwans,其实就是逐步2 Means.,每进行一次,增加一个聚类,直到达到k为止


SofaSofa数据科学社区DS面试题库 DS面经

sasa   2017-12-02 21:17



  相关讨论

K-means怎么选K?

为什么K Means算法对样本的输入顺序比较敏感?

特征归一化对K Means有影响吗?

通俗地解释c-means以及fuzzy c-means是什么意思

K Means初始点必须是样本中的点吗

kmeans可以用在三维数据上吗?

Jenks和K Means在一维数据时,是不是等价的?

kmeans可以做并行化计算达到加速效果吗?

kernal kmeans是什么意思?和一般的kmeans的区别是什么?

关于online KMeans步骤中成员更新分类的问题?

  随便看看

协方差矩阵一定是满秩的吗?

什么是K-Modes(K众数)聚类法?

Random Forest可以用来做聚类?

dropout rate一般设置多大?

Resnet-18, Resnet-50, Resnet-101这些模型里的数字是什么意思?