matlab强化学习 - Matlab在线 - matlabol - 专业的matlab资源下载站

说明：时序差分学习是强化学习的一种重要算法，该代码提供了时序差分学习做路径规划的一个仿真。

说明：使用Q学习的一种强化学习算法，针对路径规划问题，用Q学习的方法解决

matlab Q学习仿真

说明：基于Q学习算法，寻找最优路径，是强化学习中的一种，很实用，代码很详细，有备注

说明：模拟机器人路径规划，采用强化学习中的Q学习算法来实现，最后会返回机器人选择路径的坐标位置

强化学习

说明：基于强化学习的路径寻找，一种自学习方法，无需人为干预，是人工智能的热门领域，可应用于机器人路径规划，机械臂控制领域

说明：强化学习的Q算法matlab代码。适合寻找最优路径。让您对q算法一定有直观的理解！

说明：在各种非线性系统中，倒立摆是一典型例子，用强化学习实现控制倒立摆

多周期报童问题

说明：在matlab平台上，针对多周期报童问题，采用值迭代算法、策略迭代算法和强化学习算法求解MDP模型的实例

说明：基于强化学习与最优自适应控制器的智能机器人控制器。

说明：利用强化学习的自适应动态规划中的值迭代和策略迭代方法，神经网络控制方法，LQR状态调节器最优控制方法，实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强，进行了高斯白噪声的扰动实验。

相关推荐