中位数的置信区间有什么办法求解?

  统计/机器学习 描述性统计    浏览次数:8148        分享
0

对于均值,我们一般很好处理置信区间。那么对于中位数,怎么得到它的置信区间呢?

有什么常用的方法吗?

 

wlk1993   2018-05-24 12:02



   3个回答 
6

有个蒙特卡洛加bootstrap的方法。用bootstrap(sample with replacement )造N(比如10000)份新的sample,分别算出median  。再把这10000个median排序,第250和第9750的median区间就是(0.025,0.975)的median置信区间。

参考https://stats.stackexchange.com/questions/21103/confidence-interval-for-median

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-05-28 12:26

多谢! - wlk1993   2018-06-15 22:35
2

可以只考虑rank。

比如一共有$n$个数

第$\frac{n}{2}-\frac{1.96\sqrt{n}}{2}$个数作为0.95置信区间的下界

第$\frac{n+2}{2}+\frac{1.96\sqrt{n}}{2}$个数作为0.95置信区间的上界


SofaSofa数据科学社区DS面试题库 DS面经

Jiho   2018-05-28 09:23

1

均值的置信区间可以求是因为中心极限定理。中位数有类似的定理存在吗?如果没有的话我想可以观察一下你研究的总体样本中位数的分布,然后求出方差计算置信区间。

SofaSofa数据科学社区DS面试题库 DS面经

s3040608090   2018-05-24 13:33



  相关讨论

如何用python计算均值的置信区间?

怎么求1到5打分评级数据的置信区间?

怎么对两个置信区间求和?

sns barplot调整置信水平

95%置信区间是不是每一次观测都不同呢

点击率的95%置信区间该怎么算?

置信网络和贝叶斯网络是一回事吗?

怎么计算(估计)ROC AUC的置信区间?

95%置信区间的正确理解

统计学中的自变量和因变量分别是什么意思?

  随便看看

二维numpy.array转为一维的numpy.array或者list

为什么神经网络模型不用交叉验证?

把tf.Tensor转换为numpy array

线性可分是什么意思?

两个凸函数相加,还是凸函数吗?