说明:使用Q学习的一种强化学习算法,针对路径规划问题,用Q学习的方法解决
matlab 算法 学习 使用 路径 规划 问题 针对 强化
说明:基于强化学习与最优自适应控制器的智能机器人控制器。
机器人 强化学习matlab 强化学习-最优 machine-learning 最优控制
说明:自适应动态规划,数据驱动模型,神经网络,最优跟踪控制,鲁棒控制 。基于自适应动态规划方法的未知一般非线性系统的数据驱动鲁棒近似最优跟踪控制。
自适应动态规划 数据驱动模型 神经网络 最优跟踪控制 鲁棒控制
说明:强化学习的核心算法,Q-table,应用动作值函数对动作的Q值进行更新来找到最优策略。
Q-learning 核心算法 Q-table
说明:强化学习的一种,基于sarsa算法,寻找最优路径,可运行。
重要 SARSA算法