假如我有两个样本,有没有什么假设检验的方法可以判断这两个样本是否服从同一个概率分布?
4个回答
Categorical的数据:用卡方检验
Numerical的数据:用KS
Binary的数据:用T test
SofaSofa数据科学社区DS面试题库 DS面经
Binary的数据也可以用$\chi^2$
-
LiShanfei
2018-12-18 02:06
提一个我目前正在看而且比较冷门的吧,Wasserstein distance.
我觉得挺有帮助的参考文章有 Wasserstein GAN and the Kantorovich-Rubinstein Duality 还有 stackExchange上面这个问题Kullback-Leibler distance for comparing two distribution from sample points (原本以为KL divergence也可以的但是看了这个之后就有些犹豫了就不说出来了hhh)
SofaSofa数据科学社区DS面试题库 DS面经
对的,KL是不对称的;Jensen–Shannon divergence是对称的
-
黑泽先生
2022-06-16 08:27
说一个不用假设检验的想法,对于数值的概率分布,把两个分布的累积分布函数的曲线画出来,然后求两个曲线的距离(L1或者L2)。人为设置一个阈值,小于它就说明它们两条曲线够接近,分布够相似。
SofaSofa数据科学社区DS面试题库 DS面经