怎么判断一个数据集是双峰分布的,除了画出概率密度曲线来判断,还有什么好方法?
1个回答
可以先对pdf进行Kernel smoothing,然后计算平滑后的曲线的极大值点,如果算出来是两个,那就是双峰分布。这样可以避免画出pdf再肉眼观测判断。
SofaSofa数据科学社区DS面试题库 DS面经怎么判断一个数据集是双峰分布的,除了画出概率密度曲线来判断,还有什么好方法?
可以先对pdf进行Kernel smoothing,然后计算平滑后的曲线的极大值点,如果算出来是两个,那就是双峰分布。这样可以避免画出pdf再肉眼观测判断。
SofaSofa数据科学社区DS面试题库 DS面经