超级马里奥兄弟PPO-pytorch：超级马里奥兄弟的近距离策略优化（PPO）算法-源码.zip

一般编程问题

下载此实例

开发语言：Others
实例大小：172.10M
下载次数：8
浏览次数：253
发布时间：2021-12-05
实例类别：一般编程问题
发布人：js2021
文件格式：.zip
所需积分：2

网友评论举报投诉收藏该页

下载此实例

实例介绍

【实例简介】
[PYTORCH]玩超级马里奥兄弟的近战策略优化（PPO）介绍这是我的python源代码，用于训练特工玩超级马里奥兄弟。通过使用纸张近端策略优化算法推出近端政策优化（PPO）算法。说到性能，我经过PPO培训的代理可以完成29/32个级别，这比我一开始的预期要好得多。供您参考，PPO是OpenAI提出的算法，用于训练OpenAI Five，这是第一款在电竞游戏中击败世界冠军的AI。具体而言，OpenAI五人队在2018年8月派出了一支由MMR排名的脚轮和前职业球员组成的团队，在Dota 2玩家的99.95％中排名。样品结果动机自从我发布我的A3C实现（）
【实例截图】
【核心代码】
16359647507552138528.zip
└── Super-mario-bros-PPO-pytorch-master
├── demo
│   ├── video-1-1.gif
│   ├── video-1-2.gif
│   ├── video-1-3.gif
│   ├── video-1-4.gif
│   ├── video-2-1.gif
│   ├── video-2-2.gif
│   ├── video-2-3.gif
│   ├── video-2-4.gif
│   ├── video-3-1.gif
│   ├── video-3-2.gif
│   ├── video-3-3.gif
│   ├── video-3-4.gif
│   ├── video-4-1.gif
│   ├── video-4-2.gif
│   ├── video-4-3.gif
│   ├── video-5-1.gif
│   ├── video-5-2.gif
│   ├── video-5-3.gif
│   ├── video-5-4.gif
│   ├── video-6-1.gif
│   ├── video-6-2.gif
│   ├── video-6-3.gif
│   ├── video-6-4.gif
│   ├── video-7-1.gif
│   ├── video-7-2.gif
│   ├── video-7-3.gif
│   ├── video-8-1.gif
│   ├── video-8-2.gif
│   └── video-8-3.gif
├── Dockerfile
├── LICENSE
├── output
│   ├── video_1_1.mp4
│   ├── video_1_2.mp4
│   ├── video_1_3.mp4
│   ├── video_1_4.mp4
│   ├── video_2_1.mp4
│   ├── video_2_2.mp4
│   ├── video_2_3.mp4
│   ├── video_2_4.mp4
│   ├── video_3_1.mp4
│   ├── video_3_2.mp4
│   ├── video_3_3.mp4
│   ├── video_3_4.mp4
│   ├── video_4_1.mp4
│   ├── video_4_2.mp4
│   ├── video_4_3.mp4
│   ├── video_5_1.mp4
│   ├── video_5_2.mp4
│   ├── video_5_3.mp4
│   ├── video_5_4.mp4
│   ├── video_6_1.mp4
│   ├── video_6_2.mp4
│   ├── video_6_3.mp4
│   ├── video_6_4.mp4
│   ├── video_7_1.mp4
│   ├── video_7_2.mp4
│   ├── video_7_3.mp4
│   ├── video_8_1.mp4
│   ├── video_8_2.mp4
│   └── video_8_3.mp4
├── README.md
├── src
│   ├── env.py
│   ├── model.py
│   └── process.py
├── test.py
├── trained_models
│   ├── ppo_super_mario_bros_1_1
│   ├── ppo_super_mario_bros_1_2
│   ├── ppo_super_mario_bros_1_3
│   ├── ppo_super_mario_bros_1_4
│   ├── ppo_super_mario_bros_2_1
│   ├── ppo_super_mario_bros_2_2
│   ├── ppo_super_mario_bros_2_3
│   ├── ppo_super_mario_bros_2_4
│   ├── ppo_super_mario_bros_3_1
│   ├── ppo_super_mario_bros_3_2
│   ├── ppo_super_mario_bros_3_3
│   ├── ppo_super_mario_bros_3_4
│   ├── ppo_super_mario_bros_4_1
│   ├── ppo_super_mario_bros_4_2
│   ├── ppo_super_mario_bros_4_3
│   ├── ppo_super_mario_bros_5_1
│   ├── ppo_super_mario_bros_5_2
│   ├── ppo_super_mario_bros_5_3
│   ├── ppo_super_mario_bros_5_4
│   ├── ppo_super_mario_bros_6_1
│   ├── ppo_super_mario_bros_6_2
│   ├── ppo_super_mario_bros_6_3
│   ├── ppo_super_mario_bros_6_4
│   ├── ppo_super_mario_bros_7_1
│   ├── ppo_super_mario_bros_7_2
│   ├── ppo_super_mario_bros_7_3
│   ├── ppo_super_mario_bros_8_1
│   ├── ppo_super_mario_bros_8_2
│   └── ppo_super_mario_bros_8_3
└── train.py

5 directories, 95 files

标签：

实例下载地址