log-normal分布实际有什么用?什么时候需要用到这个分布?
3个回答
log-normal分布是指对一个正值的随机变量取自然对数后,这个随机变量服从$\mathcal{N}(\mu,\sigma^2)$的正态分布。
log会对大的数值压缩更大,log-normal分布是右斜的,例如
也很明显是长尾的分布,生活中很多例子都是长尾的分布,比如每个家庭的收入,产品的销量等等。
SofaSofa数据科学社区DS面试题库 DS面经log-normal适用于各种因素相乘得到结果的应用。其原理是乘法在log scale上是加法,并且基于中心极限定理,很多随机变量相加会趋近于正态分布,从而有log-normal。比如说身高,有基因,营养,运动,睡眠等等很多因素影响生长率,这些生长率的乘积是总生长率,本身生长率也是时间的函数。这些乘法性的随机变量在log scale变加法性变量,其和又满足正太分布。
SofaSofa数据科学社区DS面试题库 DS面经
这个解释不错
-
雷猴
2019-12-16 14:13