我明白AB Testing的意思,是用来做对照实验的。但是AB Testing里Geo Hashing的概念是什么意思呢?
2个回答
AB testing要求A和B的流量都是随机独立的。但是有时候无法建立这样的A和B,geo hashing可以帮助完成。
比如产品投放的城市有n个,每个城市都从1到n被随机编号,然后设计一个hash function把编号hash到{1, 2}。组1的当作A,组2的当作B,这样就实现了一个伪随机的AB testing的设置。
SofaSofa数据科学社区DS面试题库 DS面经
明白了,多谢
-
levyhou
2019-09-21 09:28
Geo Hashing其实就是AB实验哈希分流中的一种,不过是按照地理位置的id来hashing的。
安装人群(比如用户id)来做hashing基本上能保证流量的平均化,但是Geo就不一定了,所以在通过哈希得到了很多小切片之后,选择实验组和对照组的时候,需要考虑每个切片的权重(比如UV或者GMV),这样才能保证分流的结果与预期的配比是一致的。