RMSprop里参数rho和decay都是衰减的作用,它们有什么区别呢?
谢谢!!
1个回答
RMSprop在每一步会结合前几步的梯度,进行加权平均,rho是用来控制加强平均的。
decay是对learning rate进行衰减的。
两个参数的作用不同。前者控制迭代方向的改变快慢,后者控制迭代步长的大小。
SofaSofa数据科学社区DS面试题库 DS面经RMSprop里参数rho和decay都是衰减的作用,它们有什么区别呢?
谢谢!!
RMSprop在每一步会结合前几步的梯度,进行加权平均,rho是用来控制加强平均的。
decay是对learning rate进行衰减的。
两个参数的作用不同。前者控制迭代方向的改变快慢,后者控制迭代步长的大小。
SofaSofa数据科学社区DS面试题库 DS面经