策略迭代学习 - Matlab在线 - matlabol - 专业的matlab资源下载站

说明：利用强化学习的自适应动态规划中的值迭代和策略迭代方法，神经网络控制方法，LQR状态调节器最优控制方法，实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强，进行了高斯白噪声的扰动实验。

多周期报童问题

说明：在matlab平台上，针对多周期报童问题，采用值迭代算法、策略迭代算法和强化学习算法求解MDP模型的实例

相关推荐