AKatydid

Reinforcement Learning

强化学习是一种通过智能体与环境交互来学习策略的机器学习范式。智能体通过探索(采取动作)获得经验(样本),并根据环境反馈的奖励(reward)来优化行为选择,最终目标是最大化累积奖励。 强化学习擅长解决序列决策问题,尤其是状态空间大、规则复杂的任务。大致过程描述为:智能体在一个状态下采取动作,影响未来状态和奖励,目标是找到最优策略, 如 Fig 1 所示。 Fig 1. 强化学习交互过程...

Trending Tags