向量梯度下降优化的最佳步长?

  统计/机器学习 损失函数    浏览次数:1023        分享
1

想问一下,这里的步长为什么不是2倍这个东西?

我的想法是这一部分大于0。

花书上的结果是怎么算出来的啊。


 

doge233   2022-04-18 23:35



   1个回答 
6

最佳步长是找到一个步长$\epsilon^*$指能够最小化

$$f(x^{(0)})-\epsilon g^Tg+\frac{1}{2}\epsilon^2 g^THg$$

上面的式子就是一个一元二次表达式吧,对于$a\epsilon^2 + b\epsilon + c$这样的式子,最优解就是二次方程的对称轴

$$-\frac{b}{2a}=-\frac{-g^Tg}{2\frac{1}{2}g^THg}=\frac{g^Tg}{g^THg}$$

步长最优化的梯度下降又叫做最速下降法,steepest descent method。

SofaSofa数据科学社区DS面试题库 DS面经

Zeus1998   2022-04-19 00:18



  相关讨论

hinge loss的公式是什么?

focal loss是什么?

Hamming Loss汉明损失的计算公式是什么?

二元分类为什么不能用MSE做为损失函数?

怎么理解surrogate loss function代理损失函数?

关于损失函数h(x), J(x), cost的概念问题

logloss的取值范围是多少?一般好的分类器能达到多少?

python求logloss

最小二乘回归和线性回归

线性回归梯度下降函数微分推导疑惑

  随便看看

序列的autocorrelation(自相关系数)的计算公式

怎么对pandas dataframe做转置?

numpy.full这个函数有什么用?

python或者numpy求数值的中位数、四分位数

pandas.DataFrame里的loc和iloc什么区别?