全部问题问题热门未解答所有标签标签收藏收藏我要提问

相关系数中的效率指啥？

统计/机器学习描述性统计浏览次数：5050 分享

二维码

手机扫描二维码

面试中常见简答题？

连续数据，正态分布，线性关系，用pearson相关系数是最恰当，当然用spearman相关系数也可以，

就是效率没有pearson相关系数高。

如上边这句话

constant007 2019-01-02 14:10

1个回答

算spearman相关系数，先计算两组数$X，Y$排序，得到$rank_X,rank_Y$，然后再计算pearson相关系数。

排序的计算复杂度是$\mathcal{O}(n\log{}n)$，算pearson相关系数的计算复杂度是$\mathcal{O}(n)$。所以spearman相关系数的计算复杂度主要受排序的影响，效率低点。

SofaSofa数据科学社区 DS面试题库 DS面经

Zealing 2019-01-05 04:05

相关讨论

一个连续变量和一个二元变量的相关系数怎么求？

有序分类变量的相关系数

如果x是等级变量， y是连续变量相关分析是不是用speaman

Python计算两个数组的相关系数

为啥计算pearson相关系数和线性回归的coef不同呢

回归中自变量和因变量的相关系数和回归系数（斜率）有什么关系？

两个变量不相关但是也不独立

相关系数的p值是怎么算的？

如何对两个名义分类变量的关联性进行可视化展示？

序列的autocorrelation（自相关系数）的计算公式

随便看看

如何在numpy array尾部增加一行

sklearn r2_score返回负数

sklearn SGDClassifier的partial_fit是什么意思？

怎么直观理解ROC AUC的概率统计意义？

请问在sklearn怎么在已有的模型的基础上训练新的数据？