相关系数中的效率指啥?

  统计/机器学习 描述性统计    浏览次数:3822        分享
0

连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,

就是效率没有pearson相关系数高。


如上边这句话

 

constant007   2019-01-02 14:10



   1个回答 
2

算spearman相关系数,先计算两组数$X,Y$排序,得到$rank_X,rank_Y$,然后再计算pearson相关系数。

排序的计算复杂度是$\mathcal{O}(n\log{}n)$,算pearson相关系数的计算复杂度是$\mathcal{O}(n)$。所以spearman相关系数的计算复杂度主要受排序的影响,效率低点。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2019-01-05 04:05



  相关讨论

一个连续变量和一个二元变量的相关系数怎么求?

有序分类变量的相关系数

如果x是等级变量, y是连续变量 相关分析是不是用speaman

Python计算两个数组的相关系数

为啥计算pearson相关系数和线性回归的coef不同呢

回归中自变量和因变量的相关系数和回归系数(斜率)有什么关系?

两个变量不相关但是也不独立

相关系数的p值是怎么算的?

如何对两个名义分类变量的关联性进行可视化展示?

序列的autocorrelation(自相关系数)的计算公式

  随便看看

如何在numpy array尾部增加一行

sklearn r2_score返回负数

sklearn SGDClassifier的partial_fit是什么意思?

怎么直观理解ROC AUC的概率统计意义?

请问在sklearn怎么在已有的模型的基础上训练新的数据?