请教如何通俗地解释c-means以及fuzzy c-means是什么意思?
它们与k-means是什么联系?
2个回答
刚好最近才学过这个,FCM就是拓展版的K-means。FCM允许每个数据点以某个权重分到多个不同cluster里面。
FCM中想要最小化的目标函数是
$$F=\sum_{i=1}^n \sum_{j=1}^k \mu_{i,j}^m\|x_i-c_j\|^2$$
并满足限制条件
$$\sum_{j=1}^k \mu_{i,j}=1, \forall i$$
以及
$$\mu_{i,j}\geq 0, \forall i,j$$
上面式子中的$\mu_{i,j}$表示第$i$个数据点被分配到第$j$个cluster的概率。$c_j$是cluster的中心点。$m$是个超参数,当$m=1$的时候,FCM就等价于Kmeans,所以一般来说$m$是大于1的。
SofaSofa数据科学社区DS面试题库 DS面经
清晰,6
-
jimmy
2020-06-25 22:33
c-means就是fuzzy c-means,一般简称是FCM。
FCM和K-means一样,在开始聚类前,要先确定cluster的个数。
与K Means不同的是,FCM最后返回的是每个样本点属于某个聚类的概率。所以FCM是一种软聚类算法。有时候FCM也被叫做软K-Means。