AB实验的哈希分桶技术是什么意思?
1个回答
哈希就是hashing,把一个字符或者数组映射到另一个数字的过程,这个映射往往是多到一的映射。
比较典型的是取余操作,把自然数mod 8,那这个hashing操作完之后,就剩下8组,分别是0,1,...,7。
哈希在AB实验的应用就是为了分组(或者说分流,分桶)。我们知道AB实验要保证其中的随机性,和公平性。这个就是通过哈希来完成了,但是为了增加AB实验的随机公平性,往往会进行两次选择。
上面是一个例子。在实际操作中哈希映射可能会更复杂一些,而在第二步中可能会产生更多的组,比如100组甚至500组,这样做的好处很多,
1)在最后一步选择实验组和对照组的时候,随机性更强
2)因为不是所有的AB实验都是50对50,分组更多,便于进行任意配比的小流量实验
3)方便多个实验同时进行,通过组的选择来确保正交性