一个连续变量和一个二元变量的相关系数怎么求?

  统计/机器学习 描述性统计    浏览次数:6098        分享
0

一个连续变量和一个二元变量的相关系数怎么求?

还是用皮尔逊相关系数?


 

吴昊通   2018-03-31 23:24



   2个回答 
3

可以把它看作是逻辑回归,连续变量是自变量,二元变量是因变量,回归系数或者logloss都能反映出两个变量的相关性

SofaSofa数据科学社区DS面试题库 DS面经

WinJ   2018-11-05 14:40

2

Point-biserial相关系数,了解一下。

总体来说,其实它就是等价于皮尔逊系数的,直接用皮尔逊就好了。


SofaSofa数据科学社区DS面试题库 DS面经

MangoCoke   2018-04-01 21:34



  相关讨论

相关系数中的效率指啥?

如果x是等级变量, y是连续变量 相关分析是不是用speaman

有序分类变量的相关系数

Python计算两个数组的相关系数

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?

为啥计算pearson相关系数和线性回归的coef不同呢

两个变量不相关但是也不独立

相关系数的p值是怎么算的?

如何对两个名义分类变量的关联性进行可视化展示?

为什么说皮尔逊相关系数是刻画了线性相关性?

  随便看看

二元分类为什么不能用MSE做为损失函数?

人工神经网络有哪些常用的激活函数?

如何检验两个样本是同分布的?

pandas读取csv中指定的某些列

怎么提取pandas dataframe中某一列每个字符串的前n个字符?