对于均值,我们一般很好处理置信区间。那么对于中位数,怎么得到它的置信区间呢?
有什么常用的方法吗?
3个回答
有个蒙特卡洛加bootstrap的方法。用bootstrap(sample with replacement )造N(比如10000)份新的sample,分别算出median 。再把这10000个median排序,第250和第9750的median区间就是(0.025,0.975)的median置信区间。
参考https://stats.stackexchange.com/questions/21103/confidence-interval-for-median
SofaSofa数据科学社区DS面试题库 DS面经
多谢!
-
wlk1993
2018-06-15 22:35
可以只考虑rank。
比如一共有$n$个数
第$\frac{n}{2}-\frac{1.96\sqrt{n}}{2}$个数作为0.95置信区间的下界
第$\frac{n+2}{2}+\frac{1.96\sqrt{n}}{2}$个数作为0.95置信区间的上界
均值的置信区间可以求是因为中心极限定理。中位数有类似的定理存在吗?如果没有的话我想可以观察一下你研究的总体样本中位数的分布,然后求出方差计算置信区间。
SofaSofa数据科学社区DS面试题库 DS面经