说明:本程序用差分进化算法来优化神经网络,克服局部最优,使得全局最优,亲测可用。
说明:本程序用差分进化算法来优化神经网络,克服局部最优,使得全局最优,亲测可用
说明:RBF为径向基函数,RBF网络把网络看作对未知函数的逼近器。输入信号为正弦信号u(k)=0.35sin(3*pi*t),采用时间为0.001s,网络隐层神经元个数取m=4,网络结构为输入层2-隐层4-输出1,网络的出事全职取随机值,高斯函数的初始值取Cj=[0.65,0.65]T,B=[1.35,1...
说明:强化学习的核心算法,Q-table,应用动作值函数对动作的Q值进行更新来找到最优策略。