说明:一种基于视觉注意力机制的深度循环Q网络模型_翟建伟
强化学习
说明:Q-learning 算法实现AGV的最优路径规划,实测效果非常好,对于研究深度学习和强化学习的同学很有帮助!
Q-learning算法实现 AGV 路径规划 Q-learning