dropout rate一般设置多大?

  统计/机器学习 深度学习 人工神经网络    浏览次数:41488        分享
3

请教一下大家,神经网络里dropout rate一般设置多大?有什么技巧吗?

谢谢。

 

waccam   2018-03-23 21:58



   3个回答 
7

主要还是根据自己的需要,这个也是hyper parameter,可以根据结果好坏来调整

一般在输入层dropout的比较少,dropout rate是0.1甚至0.

在中间可以稍微大一点,比如0.5。dropout的一个目的是在每批训练时,通过dropout产生不同的网络结构。当dropout在0.5的时候,网络结构会更大的变化。所以0.5是非常常用的。


SofaSofa数据科学社区DS面试题库 DS面经

道画师   2018-03-26 22:09

5

我的经验是决定dropout之前,需要先判断是否模型过拟合

先dropout=0, 训练后得到模型的一些指标(比如:  F1, Accuracy, AP)。比较train数据集和test数据集的指标。

  • 过拟合:尝试下面的步骤。
  • 欠拟合:尝试调整模型的结构,暂时忽略下面步骤。

dropout设置成0.4-0.6之间, 再次训练得到模型的一些指标。

  • 如果过拟合明显好转,但指标也下降明显,可以尝试减少dropout(0.2)
  • 如果过拟合还是严重,增加dropout(0.2)

重复上面的步骤多次,就可以找到理想的dropout值了。


SofaSofa数据科学社区DS面试题库 DS面经

eipi10   2018-07-15 08:06

1

0.4到0.6之间吧


SofaSofa数据科学社区DS面试题库 DS面经

orz_k   2018-03-24 22:34

这个之间完全训练不出来。。。 - charmby   2018-12-29 15:27


  相关讨论

请问深度学习算法中的梯度消失的原理是什么?如何能通俗理解

深度学习和人工神经网络是一回事吗?

deep learning中的pooling是什么意思?

为什么小数据不适合神经网络模型?

反向传播和梯度算法概念???反向传播是指反向传播算法,还是反向传播算法中的一个过程?

深度学习模型的“蒸馏”是什么意思?

神经网络模型里训练和推理是什么意思?

神经网络中的gradient check是什么意思?

吴恩达深度学习第一课第四周作业L层结果收敛在0.64的问题

wide-deep模型里的wide和deep分别是指什么意思?

  随便看看

怎么对pandas dataframe做转置?

ARIMA模型中的三个参数(p, d, q)都是什么意思?

seaborn如何显示图?

怎么把pandas dataframe中的一列转成一个list?

什么是混淆矩阵(confusion matrix)