自助法(bootstrap)就是从样本中有放回的抽样。如果样本集中有n个样本,要自助法选出n个样本,那么一个样本被选出的概率是0.632。请问这个是怎么来的?有证明吗?谢谢!
1个回答
有n个样本,我们有放回的随机从中抽取n次。
在第一次抽取时,样本A被选中的概率是1n,不被选中的概率自然就是1−1n。每次抽取都是独立的,所以当抽完n次之后,A一次都没有被抽中的概率就是
(1−1n)n.
这个式子眼熟吗?这个就是高等数学中那个著名的极限
lim
所以当bootstrap样本总数很大的时候,任意一个样本被抽中的概率就是1-\frac{1}{e}\approx1-\frac{1}{2.71828}\approx0.632。
两年前面试还被问到过,可惜当时一脸懵X了
-
Nagozi
2018-04-02 07:57
有点6,大一高数两个重要极限
-
chrisliang
2019-01-14 15:42