全部问题问题热门未解答所有标签标签收藏收藏我要提问

Bellman equation里没有梯度下降为什么会有学习率？

统计/机器学习强化学习浏览次数：4175 分享

二维码

手机扫描二维码

机器学习面试也能刷题？

Q learning的迭代过程需要用到Bellman equation。Bellman equation其中一个变量是学习率，但是这个式子本身并没有涉及到梯度或者梯度下降的概念，为什么会有学习率呢？

wxjjnss 2018-12-02 13:32

1个回答

学习率和梯度下降算法并没有直接关系。学习率是指模型根据新样本更新模型参数的“速率”。

比如Q-learning里就是根据一个新的数据点（新的行为和奖励），来更新Q-table里的数值；如果学习率太大，新样本的权重就太大，忽略了历史数据的作用。

SofaSofa数据科学社区 DS面试题库 DS面经

Marvin_THU 2018-12-07 12:34

谢谢 - wxjjnss 2018-12-08 14:35

相关讨论

Q-learning里的Q是什么意思？

关于DQN训练速度慢的问题

关于举办“迁移学习(Transfer Learning)核心技术

计算机视觉与信息最新技术

用tensorflow实现强化学习的dql算法报错：tensorflow.python.framework.errors_impl.InternalError: Could not find valid device for node. Node: {{node OneHot}} = OneHot[T=DT_FLOAT, TI=DT_FLOAT, axis=-1](dummy_input, dummy_input, dummy_input, dummy_input)

关于张量运算，求问框框部分运算是怎么计算的？具体运算规则是怎样的？

深度强化学习课程介绍

深度强化学习核心课程

迁移学习(Transfer Learning)核心技术课程开课了

随便看看

医学统计里的c-index或者c-statistic是什么意思？

自助法(bootstrap)的0.632是怎么来的？

查看sklearn的线性回归系数的p value

两个独立的正态随机变量的乘积服从什么分布？

为什么过拟合不好？