策略迭代法 - Matlab在线 - matlabol - 专业的matlab资源下载站

经典的基于策略迭代和值迭代法的动态规划matlab代码，实现机器人的最优运输

说明：经典的基于策略迭代和值迭代法的动态规划matlab代码，实现机器人的最优运输。

策略迭代策略迭代-matlab dynamic-programming 动态规划策略迭代法

马尔科夫决策过程值迭代算法value iteration

说明：马尔科夫决策过程值迭代算法value iteration，策略迭代等函数代码，从国外网站下载，非常详细，有用。

策略迭代MATLAB 马尔科夫决策迭代策略马尔科夫迭代 value-iteration

三维倒立摆在飞行器上的稳定控制

说明：利用强化学习的自适应动态规划中的值迭代和策略迭代方法，神经网络控制方法，LQR状态调节器最优控制方法，实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强，进行了高斯白噪声的扰动实验。

inverted neural Adaptive dynamic 策略迭代学习策略迭代 matlab 策略迭代控制

多周期报童问题

说明：在matlab平台上，针对多周期报童问题，采用值迭代算法、策略迭代算法和强化学习算法求解MDP模型的实例

报童模型强化学习matlab 策略迭代-matlab 策略迭代强化学习算法

归一化LMS算法（NLMS算法）

说明：若不希望用与估计输入信号矢量有关的相关矩阵来加快LMS算法的收敛速度，那么可用变步长方法来缩短其自适应收敛过程，其中一个主要的方法是归一化LMS算法（NLMS算法），变步长的更新公式可写成 W（n+1）=w（n）+ e（n）x（n） =w（n）+ （3.1）式中， = e（n）x（n）表示滤波权...

变步长NLMS 变步长的LMS 变步长LMS算法策略迭代 LMS-步长-误差

123

说明：123

全国大学生数学建模竞赛(CUMCM)

相关推荐