如图,谢谢大家
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
北斗 2018-10-11 13:56
上面那个Bellman公式里就是二重循环吧
至于方框里的那个我也不是很懂,它被写成了矩阵和张量的乘法,但是这个东西还没有定义呢吧?
WinJ 2018-10-12 11:50
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
用tensorflow实现强化学习的dql算法报错:tensorflow.python.framework.errors_impl.InternalError: Could not find valid device for node. Node: {{node OneHot}} = OneHot[T=DT_FLOAT, TI=DT_FLOAT, axis=-1](dummy_input, dummy_input, dummy_input, dummy_input)
关于举办“迁移学习(Transfer Learning)核心技术
计算机视觉与信息最新技术
Bellman equation里没有梯度下降为什么会有学习率?
RNN
Q-learning里的Q是什么意思?
深度强化学习课程介绍
关于DQN训练速度慢的问题
迁移学习(Transfer Learning)核心技术课程开课了
深度强化学习核心课程
随便看看
95%置信区间的正确理解
随机森林(random forest)和支持向量机(SVM)各有什么优劣
多个独立同分布的均匀随机变量的最小值的期望是多少?
激活函数RELU在0点的导数是多少?
前馈神经网络如何选择隐藏层的数量