谱聚类最后的K-Means会把所有全零行分到一个簇吗

  统计/机器学习 无监督学习 数据降维    浏览次数:2415        分享
0

谱聚类在求得L的K1个最小特征值及其对应的特征向量以后,由特征向量组成N*K1维的特征矩阵F,然后还需要将F中的每一行作为一个K1维的样本,共N个样本,进行K-Means聚类。

个人理解,这里的每个特征向量,即F矩阵的每一列,表示一个指示向量h,也即一个簇。而每一行表示一个样本。根据指示向量的定义,属于该簇为非0,不属于为0,则每一行只会出现一个非0值,表示改样本隶属于哪个簇。所以实际上,这步以后已经分出K1个簇,只是由于K1可能很小,所以K1个指示向量并不能指出全部N个样本的分类,所以需要再度聚类。

但问题是,对于未被分类的样本,即该样本不隶属于这K1个簇中的任何一个,那一行必定是全0。那如果用K means来聚类,所有这样的样本必定都是全0,必定都会别聚类到某一个簇里去?那还有什么意义呢。。。。

不知道我说明了白没有。。。疑惑很久了。请大神指教。谢谢!

 

wetwing   2020-05-11 21:36



    还没有回答。我来答!  


  相关讨论

k-medoids和k-means区别

关于小批量K均值(mini-batch K Means)的问题

关于online KMeans步骤中成员更新分类的问题?

kernal kmeans是什么意思?和一般的kmeans的区别是什么?

kmeans可以用在三维数据上吗?

Jenks和K Means在一维数据时,是不是等价的?

K Means初始点必须是样本中的点吗

K-Means实现mini-batch online learning的原理是什么?

通俗地解释c-means以及fuzzy c-means是什么意思

K-MEANS初始点选择的问题

  随便看看

神经网络里为什么隐藏层越多越好?

怎么把dataframe的一列转成整数类型

deep learning中的pooling是什么意思?

python pandas里有没有类似R的summary的函数?

样本权重大小不同时,用什么分类算法比较合适?