说明:Actor-Critic简单应用例子,连续状态空间,离散动作。
说明:HVDC Light连续时间状态空间模型的matlab仿真
说明:1. 通过按键(W,A,S,D或方向键)控制小块的移动方向,当有两个小块相同时,把两者合并,产生一个新块(其值90%为2,10%为4)。并给予一定的分数,记录在数据文件中,显示在界面上。 2. 当最大块的值达到2048时,您将获得胜利,胜利后您可以选择继续游戏(当最大块的值为4096时,您将获得连...
说明:【2017国赛A题参考资料】参考资料大合集