强化学习(增强学习)是监督式学习还是无监督式学习?还是所谓的什么半监督学习?
1个回答
强化学习既不是有监督学习也不是无监督学习。
强化学习是自我强化的,在最开始强化学习没有任何有标签的数据。
但是模型在给出判断或者决策之后,会接受到外界反馈的数据,根据反馈,模型进行学习,然后做出下一次决策/判断,再得到新的反馈,然后这么一直进行下去。
所以强化学习和传统观念里的有监督学习和无监督学习都不一样。
强化学习(增强学习)是监督式学习还是无监督式学习?还是所谓的什么半监督学习?
强化学习既不是有监督学习也不是无监督学习。
强化学习是自我强化的,在最开始强化学习没有任何有标签的数据。
但是模型在给出判断或者决策之后,会接受到外界反馈的数据,根据反馈,模型进行学习,然后做出下一次决策/判断,再得到新的反馈,然后这么一直进行下去。
所以强化学习和传统观念里的有监督学习和无监督学习都不一样。