二项分布的正态近似

  统计/机器学习 概率分布    浏览次数:16322        分享
1

问题背景:一个实验成功的概率是0.4,重复1000次,成功500次以上的概率是多大?

当然我们是可以根据二项分布直接算的,但是要求和,计算量特别大。

我记得可以用正态分布去逼近二项分布,简便地计算上面的概率。可惜以前学得都还给老师了,有谁可以帮帮?

 

ZackLi   2017-05-24 09:43



   2个回答 
3
二项分布中期望为np,方差为np(1-p)。当n足够大时,二项分布近似正态分布。此时可用二项分布的期望和方差作为正态分布的期望和方差。知道了正态分布的期望和方差就好做了。直接计算p(x>=500)就行了。SofaSofa数据科学社区DS面试题库 DS面经

空白回忆1325   2017-05-24 15:01

3

$p=0.4$, $np=400$, $np(1-p)=240$,成功次数是符合$N(400,240)$正态分布的。

$$z=\frac{500-400}{\sqrt{240}}=6.455$$

z值大于3的概率是0.0013。大于6的概率就几乎等于0了。

SofaSofa数据科学社区DS面试题库 DS面经

Gakki   2017-05-26 11:49



  相关讨论

长尾分布、肥尾分布、重尾分布?

机器学习中,数据的分布是指什么呢?

强大数定律和弱大数定律有什么区别?

怎么理解tweedie分布?

两个独立的正态随机变量的乘积服从什么分布?

odds和odds ratio的定义是什么?

Weibull分布是什么分布?现实中有什么例子?

X,Y 独立并且,X~U(0,2)以及Y∼U(1,3)。求max(X,Y) 的期望。

怎么判断一个数据集是双峰分布的?

均匀分布的上限的最大似然估计

  随便看看

plt.scatter plot怎么让不同的类别有不同的颜色

ARIMA模型中的三个参数(p, d, q)都是什么意思?

opencv里waitkey和destroyAllWindows有什么用?

随机梯度下降(sgd)的收敛问题

wide-deep模型里的wide和deep分别是指什么意思?