自助法(bootstrap)就是从样本中有放回的抽样。如果样本集中有n个样本,要自助法选出n个样本,那么一个样本被选出的概率是0.632。请问这个是怎么来的?有证明吗?谢谢!
1个回答
有$n$个样本,我们有放回的随机从中抽取$n$次。
在第一次抽取时,样本A被选中的概率是$\frac{1}{n}$,不被选中的概率自然就是$1-\frac{1}{n}$。每次抽取都是独立的,所以当抽完$n$次之后,A一次都没有被抽中的概率就是
$$(1-\frac{1}{n})^n.$$
这个式子眼熟吗?这个就是高等数学中那个著名的极限
$$\lim_{n\rightarrow\infty}(1-\frac{1}n)^n=\frac{1}{e}.$$
所以当bootstrap样本总数很大的时候,任意一个样本被抽中的概率就是$1-\frac{1}{e}\approx1-\frac{1}{2.71828}\approx0.632$。
两年前面试还被问到过,可惜当时一脸懵X了
-
Nagozi
2018-04-02 07:57
有点6,大一高数两个重要极限
-
chrisliang
2019-01-14 15:42