说明:利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪声的扰动实验。
inverted neural Adaptive dynamic 策略迭代学习 策略迭代 matlab 策略迭代控制
说明:迭代功率选择,运用博弈论循环迭代功率分配策略,使系统性能达到最优。
迭代功率 纳什均衡