softmax模型和最大熵模型是否是一回事?

  统计/机器学习 监督式学习 开放问题    浏览次数:4377        分享
0

我有个问题,softmax模型是不是就是李航老师书里的最大熵模型?那logistics模型是最大熵模型吗?

 

kunkunkun   2019-02-09 13:24



   1个回答 
5

对,Multinomial logistic regression wiki中:


但是在李航的《统计学习方法》中有点不同。

Multinomial logistic regression是:


maximum entropy是:


它们不同是(6.7)中$w_k$是$n$维向量,参数$w_{k,i}$的总数共有$nK$。而(6.22)中$w_i$总数只有$n$个,对于不同$y=k$,它们共享相同的参数,$w_{k,i}=w_i$。共享参数的原因是maximum entropy 中只有 $n$个限制条件。


如果改为$nK$个限制条件,比如 $E_{P(y=k)}(f_i)=E_{\tilde{P} (y=k)}(f_i)$,二者就一样了。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2019-02-12 03:49

多谢大佬指点 - kunkunkun   2019-02-13 14:39


  相关讨论

离散随机变量的熵满足的不等式如何证明?

Gini指数、Gini系数、Gini不纯是一回事吗?

求问:Cart分类树为什么是基尼指数最小化准则

决策树的熵是什么?怎么用熵来选分叉?

cross entropy是什么意思?

python里怎么计算一个数组的熵(entropy)?

pytorch 的交叉熵损失总是报错,同样的结构改成MSELoss就没有问题

最小描述长度和香农熵有什么关系?

为什么决策树中用熵而不是基尼不纯度来作为划分依据?

keras里sparse_categorical_crossentropy和categorical_crossentropy什么不同?

  随便看看

为什么过拟合不好?

lightgbm.LGBMModel和lightgbm.LGBMClassifier该用哪个?

线性回归需要满足哪些基本前提假设

seaborn.distplot直方图的y轴的数值是什么意思?

二元分类为什么不能用MSE做为损失函数?