K Means算法的一个明显缺陷就是慢,那么还有哪些缺陷和劣势呢?
5个回答
- K-Means计算量大,速度慢
- K -Means对迭代初始点的选择比较敏感,容易陷入局部最小值
- K-Means对高维数据表现不佳(慢,高维数据容易稀疏)
- K-Means对categorical feature不能直接处理
- K means对样本的输入顺序比较敏感
- K means对数值特征的缩放也非常敏感
K means和Knn在模型上有一些共性,所以缺点也类型。可以额外阅读以下:kNN算法有哪些缺点?
-----------补充一下------------
我上面说的第二点不是很准确,因为对于batch K Means,顺序是不影响结果的。
感谢各位的讨论,为什么K Means算法对样本的输入顺序比较敏感?
SofaSofa数据科学社区DS面试题库 DS面经
已更新,谢谢提醒
-
数据科学小K
2018-10-10 14:20