1个回答
对于GMM:
当分类标签已知时,complete data log likelihood是convex函数,有唯一全局最优。
当分类标签未知时,observed data log likelihood不是convex函数,有局部最优,此时EM 对初始值敏感。
参考murphy书的11.3.2。(把这一页贴上来,希望没版权问题。)
11.15式中$z_i$未知,需要用积分去掉$z_i$;其中两项都是convex,两个convex相减一般是nonconvex。
SofaSofa数据科学社区DS面试题库 DS面经
“分类标签已知”是指知道每类的均值和方差吗?
-
萨浪嘿
2019-06-27 00:56
分类标签是每个数据点属于哪个类(Gaussian component)的one-hot编码,比如说https://en.wikipedia.org/wiki/Mixture_model#Gaussian_mixture_model 的$z_i$。均值和方差是需要估计的统计参数$\theta$。
-
Zealing
2019-06-27 01:47
明白了,谢谢大佬
-
萨浪嘿
2019-06-28 14:39