谱聚类中的相似矩阵是怎么定义的?我看网上有的资料说是就是两个点的欧式距离,是这样吗?
谢谢!
1个回答
基本上是这个意思。Spectral Clustering是用了一些图论的思想。
Spectral Clustering主要分三步:1. 构造相似矩阵,2. 进行谱分解,3. 进行划分完成聚类。
相似矩阵是描述样本与样本之间的相似性的。如果有$n$个样本,那么相似矩阵$A$就是$n\times n$的,其中$A_{i,j}$表示第$i$个样本和第$j$个样本的相似性,$A_{i,i}$规定为0。
相似性有很多度量方式。Spectral Clustering也可以采用kNN的思想,最近的k个点可以标记相似度为1,其余的点可以标记为相似度为0。当然也可以直接取欧式距离的倒数为相似值。
SofaSofa数据科学社区DS面试题库 DS面经