说明:经典的基于策略迭代和值迭代法的动态规划matlab代码,实现机器人的最优运输。
策略迭代 策略迭代-matlab dynamic-programming 动态规划 策略迭代法
说明:马尔科夫决策过程值迭代算法value iteration,策略迭代等函数代码,从国外网站下载,非常详细,有用。
策略迭代MATLAB 马尔科夫决策 迭代策略 马尔科夫迭代 value-iteration
说明:利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪声的扰动实验。
inverted neural Adaptive dynamic 策略迭代学习 策略迭代 matlab 策略迭代控制
说明:迭代功率选择,运用博弈论循环迭代功率分配策略,使系统性能达到最优。
迭代功率 纳什均衡
说明:在matlab平台上,针对多周期报童问题,采用值迭代算法、策略迭代算法和强化学习算法求解MDP模型的实例
报童模型 强化学习matlab 策略迭代-matlab 策略迭代 强化学习算法
说明:若不希望用与估计输入信号矢量有关的相关矩阵来加快LMS算法的收敛速度,那么可用变步长方法来缩短其自适应收敛过程,其中一个主要的方法是归一化LMS算法(NLMS算法),变步长 的更新公式可写成 W(n+1)=w(n)+ e(n)x(n) =w(n)+ (3.1) 式中, = e(n)x(n)表示滤波权...
变步长NLMS 变步长的LMS 变步长LMS算法 策略迭代 LMS-步长-误差
说明:123
全国大学生数学建模竞赛(CUMCM)
说明:B题相关的部分研究生论文