二分法K Means的算法是什么?和普通的K Means有什么区别?
谢谢!
2个回答
二分法K Means(bisecting K Means)其实可以看作是一种阶层聚类(hierarchical clustering)方法。
- 第一步、确定K的大小
- 所有点都被在一个cluster当中
- 对所有点进行2 Means,得到两个聚类,比如说C1,C2
- 对C1或者C2进行2 Means,从而又一个聚类被一分为二,此时,我们就有三个cluster,C1,C2,C3
- 对C1,C2或者C3其中一个clustering再进行2 Means,此时我们就有4个cluster。
- 反复进行,直到我们产生出K个cluster为止。
二分法K Means可以保证收敛到最优,而普通的K Means却不能。
第4步里面“对C1或者C2进行2 Means”,那到底是C1还是C2呢?怎么确定的呢?
-
PR
2017-11-30 10:48
C1,C2两个都试试,分别计算SSE(sum of squared errors),哪个SSE小就选哪个
-
岛歌
2017-11-30 22:52