说明:关于报童问题的MATLAB仿真,其中分别进行了了均匀分布、负指数分布和高斯分布的方正。
报童问题
说明:在matlab平台上,针对多周期报童问题,采用值迭代算法、策略迭代算法和强化学习算法求解MDP模型的实例
报童模型 强化学习matlab 策略迭代-matlab 策略迭代 强化学习算法