我了解的boostrap应该是一种抽样方法,那它主要应用在哪些方面,和Cross-validation又有什么区别呢?
1个回答
bootstrap和cross-validation本质上是完全两回事。
bootstrap说白了就是有放回的抽样。它的目的是降低estimate的variance。
1. 比如我们可以用bootstrap的方法数值上计算假设检验的p值。
2. 比如我们可以用bootstrap的方法来估计一个总体的某个统计量(比如均值、中位数)
3. 比如建模的时候用bootstrap的方法来选训练样本,得到多个训练模型。对多个模型组合,这个就是Bagging,Bootstrap aggregating。
cross-validation是进行模型验证的。cross-validation中的fold是随机选的,但是绝对不是bootstrap,因为fold抽样不是有放回的。