两阶段抽样和分层抽样是一回事吗?

  统计/机器学习 抽样方法    浏览次数:5573        分享
0

关于抽样的方法,我有个疑问,两阶段抽样和分层抽样是一回事吗?

 

luzehao   2018-11-16 11:43



   1个回答 
3

它们比较像,但是不完全一样。

当我们想要获得某个观测量$y$,但是$y$可能不易获得。于是我们借助于某个辅助变量$x$(这个变量比较容易获得)。两阶段抽样是先从总体里随机选取一批样本$S_1$,然后观测每个样本的辅助变量$x$,根据$x$再从$S_1$中挑选一批样本,作为最后的样本来估计$y$。

分层抽样是直接根据某个指标分布来进行抽样,比如想调查某地区小朋友的营养状况,该地区男孩550,女孩450人,所以抽样的时候也是按照这个比例,比如可以抽样22个男生,18个女生。

SofaSofa数据科学社区DS面试题库 DS面经

Jiho   2018-12-02 11:32



  相关讨论

蓄水池抽样算法的问题

自助法(bootstrap)的0.632是怎么来的?

parametric bootstrap和nonparametric bootstrap的区别是什么?

滚雪球抽样算法的实现

bootstrap 一般用在哪些方面

Jackknife vs Bootstrap

python产生一个随机置换?

python对给定的集合进行有放回抽样?

把训练集分成n份,用同种算法在每个子训练集上训练再把预测平均,效果如何?

SMOTE对于categorical feature如何处理?

  随便看看

logloss的取值范围是多少?一般好的分类器能达到多少?

怎么对2维的numpy array取整?

求多个torch tensor的平均值

如果样本不是正态分布,还能用t-test或者z-test吗?

sklearn r2_score返回负数