AB实验的哈希分桶技术是什么意思?

  统计/机器学习 AB Test    浏览次数:1323        分享
1

AB实验的哈希分桶技术是什么意思?

 

jimmy   2022-04-08 15:33



   1个回答 
5

哈希就是hashing,把一个字符或者数组映射到另一个数字的过程,这个映射往往是多到一的映射。

比较典型的是取余操作,把自然数mod 8,那这个hashing操作完之后,就剩下8组,分别是0,1,...,7。


哈希在AB实验的应用就是为了分组(或者说分流,分桶)。我们知道AB实验要保证其中的随机性,和公平性。这个就是通过哈希来完成了,但是为了增加AB实验的随机公平性,往往会进行两次选择。



上面是一个例子。在实际操作中哈希映射可能会更复杂一些,而在第二步中可能会产生更多的组,比如100组甚至500组,这样做的好处很多,

1)在最后一步选择实验组和对照组的时候,随机性更强

2)因为不是所有的AB实验都是50对50,分组更多,便于进行任意配比的小流量实验

3)方便多个实验同时进行,通过组的选择来确保正交性

SofaSofa数据科学社区DS面试题库 DS面经

Zeus1998   2022-04-17 09:43



  相关讨论

AB Testing里Geo Hashing是什么意思?

AB检验里的spillover effect是什么意思?

AB测试样本量的问题

AB实验里的灰度实验概念是什么意思?

双盲实验是什么意思?

AB检测里selection bias是什么?

如果样本不是正态分布,还能用t-test或者z-test吗?

MAB里的tompson抽样算法是怎么操作的?

怎么提高一个假设检验的效力(power)?

如何从假设检验的角度去理解AB testing

  随便看看

为什么自然常数e等于阶乘的倒数的和?

线性回归或者逻辑回归中常提到的AIC和BIC是什么意思?

如果样本不是正态分布,还能用t-test或者z-test吗?

自助法(bootstrap)的0.632是怎么来的?

协方差矩阵一定是满秩的吗?