高斯混合模型对初始值敏感吗？-SofaSofa

刚刚看了GMM与EM的教程，想到一个问题，在用EM求解GMM时，初始值（初始状态下各聚类的中心点）是敏感的吗？换句话说，会因为初始点选择不当导致最终没有收敛到全局最优吗？

萨浪嘿 2019-06-25 00:52

1个回答

对于GMM：

当分类标签已知时，complete data log likelihood是convex函数，有唯一全局最优。

当分类标签未知时，observed data log likelihood不是convex函数，有局部最优，此时EM 对初始值敏感。

参考murphy书的11.3.2。（把这一页贴上来，希望没版权问题。）

11.15式中$z_i$未知，需要用积分去掉$z_i$；其中两项都是convex，两个convex相减一般是nonconvex。

SofaSofa数据科学社区 DS面试题库 DS面经

Zealing 2019-06-25 10:18

“分类标签已知”是指知道每类的均值和方差吗？ - 萨浪嘿 2019-06-27 00:56

分类标签是每个数据点属于哪个类（Gaussian component）的one-hot编码，比如说https://en.wikipedia.org/wiki/Mixture_model#Gaussian_mixture_model 的$z_i$。均值和方差是需要估计的统计参数$\theta$。 - Zealing 2019-06-27 01:47

明白了，谢谢大佬 - 萨浪嘿 2019-06-28 14:39

高斯混合模型对初始值敏感吗？

Warning

1个回答

Warning