关于高斯混合模型的分布的疑问

  统计/机器学习 概率分布 无监督学习    浏览次数:5767        分享
0

高斯混合模型就是很多个高斯分布的叠加

但是明明高斯分布加另一个高斯分布,还是高斯分布

那么高斯混合模型本身就应该是一个大的高斯模型啊

但是高斯混合模型的图画出来明明却又不是高斯分布,这是为什么


 

wlk1993   2018-03-12 23:38



   3个回答 
6

GMM中的叠加,不是加法的

我们说GMM中有多个高斯分布叠加,意思是说GMM中部分数据点服从一个高斯分布,另一部分服从另一个高斯分布。与其说是多个高斯分布的叠加,不如说是多个高斯分布的并集。

看下面的图应该就一目了然了


SofaSofa数据科学社区DS面试题库 DS面经

数据痴汉   2018-03-14 21:47

2

高斯混合模型的意思是说,数据中各个部分分别服从于不同的正态分布。也就是所谓多个高斯分布混合在一起。


SofaSofa数据科学社区DS面试题库 DS面经

姜金杰   2018-03-17 12:29

2

你说的两个独立的随机变量X1,X2服从高斯分布,X=X1+X2也满足高斯分布。注意是随机变量的和。

而GMM里是概率的“和”。p(x)=sum(kiN(x|mu,sigma))。

一小段Matlab:

N=100000;
x1=randn(N,1)*0.2+5;
x2=randn(N,1)*2-2;
x=x1+x2;
ww=[-10 10];
select=rand(N,1); 
idx=select>0.8;
y=zeros(N,1);
y(idx)=x1(idx);
y(~idx)=x2(~idx);
m=1000;
figure;
subplot(411);hist(x1,m),xlim(ww);title('x1')
subplot(412);hist(x2,m),xlim(ww);title('x2')
subplot(413);hist(x,m),xlim(ww);title('x=x1+x2')
subplot(414);hist(y,m),xlim(ww);title('y=GMM')


SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-03-18 10:46



  相关讨论

高斯混合模型对初始值敏感吗?

高斯混合模型里的隐变量是什么变量?

用高斯混合模型(GMM)做聚类时,怎么确定component的个数?

二项分布的正态近似

怎么理解tweedie分布?

长尾分布、肥尾分布、重尾分布?

odds和odds ratio的定义是什么?

X,Y 独立并且,X~U(0,2)以及Y∼U(1,3)。求max(X,Y) 的期望。

强大数定律和弱大数定律有什么区别?

两个独立的正态随机变量的乘积服从什么分布?

  随便看看

python去掉中文文本中所有的标点符号

python里的<<或者>>符号是什么意思?

在使用PCA降维时,有哪些坑?

牛顿法到底是一阶优化算法还是二阶优化算法?

修正R方(adjusted R square)是什么?