强化

概念: 机器学习分支之一强化学习,学习通过与环境交互进行,是一种目标导向的方法。 不告知学习者应采用行为,但其行为对于奖励惩罚,从行为后果学习。 机器人避开障碍物案例: 靠近障碍物-10分,远离障碍物+10分。 智能体自己探索获取优良奖励的各自行为,包括如下步骤: 智能体执行行为与环境交互 行为执行后,智能体从一个状态转移至另一个状态 依据行为获得相应的奖励或惩罚 智能体理解正面和反面的行为效果...

特别声明: 版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。