多重检验中的FDR(false discovery rate, 错误发现率)是什么?

  统计/机器学习 假设检验    浏览次数:26404        分享
5

多重检验中的一概念叫做FDR,False Discovery Rate,中文叫做错误发现率,这个具体是什么,怎么计算的?和多重检验什么关系?看了百度百科和维基百科都没看懂...

 

Steven0612   2017-04-02 12:19



   2个回答 
18

假如我们进行了一个有$m$个零假设的多重假设检验,我们拒绝了其中的$R$个假设,在这$R$个假设中又有$T_1$个假设是被我们错误地拒绝了,也就是说有$T_1$个Type I error。FDR的定义如下

$$FDR=\mathbb{E}\left(\frac{T_1}{\max\{R,1\}}\right).$$

如果$FDR<\alpha$,我们就说这个多重检验的FDR被控制在了$\alpha$水平。

SofaSofa数据科学社区DS面试题库 DS面经

清风   2017-04-03 05:23

错误发现率,字面上,就是错误拒绝的比例。 - 清风   2017-04-03 05:24
7

FDR就是错误发现率,在二元分类中,比如你的算法“发现”了10个阳性,实际上其中3个你搞错了,FDR=0.3

$$FDR=\frac{FP}{TP+FP}=1-Precision=1-PPV$$


SofaSofa数据科学社区DS面试题库 DS面经

道画师   2017-12-11 23:34



  相关讨论

多重比较校正

z test和t test什么区别?

spss的检验分了t,卡方,非参数,分类的依据和目的是啥

单侧T检验p值与双侧T检验p值的关系

F检验的使用场景

配对T检验和两样本T检验是一回事么?

T检验的effect size是什么?有什么含义吗?

t检验,需要测试集验证集吗?

显著水平和p值是什么关系?

Python单侧T检验

  随便看看

怎么理解surrogate loss function代理损失函数?

用户人群分层分析的RFM模型是什么?

神经网络中的dense和sparse是什么意思?

seaborn.distplot直方图的y轴的数值是什么意思?

xgboost怎么调参?