Python强化练习之PyTorch opp算法实现月球登陆器_python_脚本中心 - 编程客栈
在OpenAI Gym中用DQN玩月球着陆游戏 - 知乎
https://www.jianshu.com/p/c1db5870fb1b
Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍 | 文艺数学君
深度强化学习系列(8): Prioritized Experience Replay(PER-DQN)原理及实现_旺财搬砖记的博客-CSDN博客