比如我有一个在线的列表,但是这个在不断的增加新的数据,我应该如何设计抽样方法才能使每个元素被抽到的概率一样呢
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
sjtufrc 2017-09-08 03:21
这个问题应该就是大名鼎鼎的蓄水池问题。对应的解决方法就是蓄水池算法。
这里已经有人问过了。蓄水池抽样算法的问题
KingBug 2017-09-08 03:35
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
SMOTE对于categorical feature如何处理?
什么是SMOTE sampling方法?
滚雪球抽样算法的实现
Jackknife vs Bootstrap
自助法(bootstrap)的0.632是怎么来的?
蓄水池抽样算法的问题
parametric bootstrap和nonparametric bootstrap的区别是什么?
两阶段抽样和分层抽样是一回事吗?
bootstrap 一般用在哪些方面
python对给定的集合进行有放回抽样?
随便看看
seaborn.distplot直方图的y轴的数值是什么意思?
逻辑回归模型中变量的系数怎么理解?
python里怎么表示科学计数法?
怎么理解tweedie分布?
怎么对pandas dataframe的列求众数