两个变量不相关但是也不独立

  统计/机器学习 概率分布 描述性统计    浏览次数:11077        分享
6

我自学看书上提到了一句,即使两个变量的相关系数是零也不能说明它们是独立的。请问有没有这样的例子?谢谢!

 

MeganC   2017-02-27 00:01



   2个回答 
10

假设$X$是个随机变量服从标准正态分布,另一个随机变量$Y$满足$Y=X^2$,那么它们的协方差

$$\text{cov}(X,Y)=\text{E}(XY)-\text{E}(X)\text{E}(Y)=\text{E}(X^3)-\text{E}(X)\text{E}(X^2)=0-0\times\text{E}(X^2)=0$$

协方差为0,说明$X$和$Y$不相关。但是显然$X$和$Y$不独立。

SofaSofa数据科学社区DS面试题库 DS面经

KingBug   2017-03-04 11:21

数学公式怎么打的? - 雷猴   2017-03-04 11:43
正常打$\LaTeX$,放在单美元符号里。 - KingBug   2017-03-06 12:02
3

这样的例子其实不少,相关系数其实描述的是两个变量的线性相关性。如果线性关系强,相关系数的绝对值就大;线性关系弱,相关系数就少,甚至为0。

一个简单的例子是,$X\in [-1, 1]$,$Y=|X|$,显然$X$和$Y$的相关系数为0,但是又显然不是独立的。类似地,可以得到很多这样的例子,比如$X\in[-1, 1]$,$Y=X^m$,$m$是任意一个偶数。

SofaSofa数据科学社区DS面试题库 DS面经

u_u   2018-09-13 07:27



  相关讨论

为什么说皮尔逊相关系数是刻画了线性相关性?

如果x是等级变量, y是连续变量 相关分析是不是用speaman

相关系数中的效率指啥?

一个连续变量和一个二元变量的相关系数怎么求?

超几何分布几何分布的关联?

有序分类变量的相关系数

Python计算两个数组的相关系数

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?

为啥计算pearson相关系数和线性回归的coef不同呢

相关系数的p值是怎么算的?

  随便看看

pandas读取csv中指定的某些列

pytorch里view(-1, 1)什么意思?

把tf.Tensor转换为numpy array

python里的<<或者>>符号是什么意思?

什么是SMOTE sampling方法?