泊松回归的公式是什么?
2个回答
泊松回归是GLM中的一种,link function是log,但是并不等价于“对y取对数,然后做线性回归”。
对log(y)做线性回归,是表示log(y)服从正态分布。泊松回归是需要y服从泊松分布的,也就是
$$P(y_i|x_i, \theta)=\frac{1}{y_i!}\text{exp}(y_i\theta^Tx_i-e^{\theta^Tx_i})$$
$y_i$的均值是
$$\hat y_i = e^{\theta ^T x_i}$$
$\theta$是回归系数。求解$\theta$是根据对数最大似然估计,
$$l(y|x,\theta)=\sum_{i=1}^n\left(y_i\theta^T x_i-\text{exp}(\theta^Tx_i) - \log(y_i!)\right)$$
SofaSofa数据科学社区DS面试题库 DS面经Poisson regression实际上就是把y取log,然后做线性回归。
log(y) = ax + b
训练出a和b,然后再做预测
log(y') = ax' + b
得到预测值y' = exp(ax' + b).
SofaSofa数据科学社区DS面试题库 DS面经
这个是以10为底数的log还是以e为底数的?谢谢!
-
FTD
2017-06-06 08:10
log是以e为底的,统计里的log一般都是默认以e为底数的。
-
道画师
2017-06-06 09:30