说明:马尔科夫决策过程值迭代算法value iteration,策略迭代等函数代码,从国外网站下载,非常详细,有用。
策略迭代MATLAB 马尔科夫决策 迭代策略 马尔科夫迭代 value-iteration
说明:策略论及matlab编程实现
数学算法
说明:改进粒子群算法,比较完整,自己收集的,可以运行。
粒子群-bp rapidlyq2t 改进的粒子群 优化神经网络 基于BP神经
粒子群-bp 改进的粒子群 优化神经网络 基于BP神经
说明:利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪声的扰动实验。
inverted neural Adaptive dynamic 策略迭代学习 策略迭代 matlab 策略迭代控制
说明:加入贪婪策略和遗传算法中的变异策略的混合蚁群算法
变异蚁群算法 遗传蚁群-matlab 蚁群-遗传 混合--遗传 混合遗传蚁群
说明:对电网不平衡情况下的三相PWM整流器进行了详细的建模分析,并在此基础上研究了两种不平衡控制策略。其一是抑制网侧负序电流的控制策略,主要控制三相PWM整流器交流电流对称正弦化控制。其二是抑制直流电压谐波分量的控制策略,主要控制三相PWM整流器从电网吸收平衡的瞬时功率,消除直流电压中的各次谐波分量。
电网 不平衡 三相PWM 整流器 黄泳均
说明:在matlab平台上,针对多周期报童问题,采用值迭代算法、策略迭代算法和强化学习算法求解MDP模型的实例
报童模型 强化学习matlab 策略迭代-matlab 策略迭代 强化学习算法
说明:遗传算法优化bp神经网络,神经网络为三层网络,遗传算法带有精英保留策略
遗传-神经网络 精英保留策略 优化遗传算法 遗传算法精英 精英策略
说明:实现Q学习算法,动作选择策略为贪婪策略,存在收敛判断条件。
Q学习算法 贪婪策略