说明:利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪声的扰动实验。
inverted neural Adaptive dynamic 策略迭代学习 策略迭代 matlab 策略迭代控制
说明:在matlab平台上,针对多周期报童问题,采用值迭代算法、策略迭代算法和强化学习算法求解MDP模型的实例
报童模型 强化学习matlab 策略迭代-matlab 策略迭代 强化学习算法