简洁明了的强化学习python示例

一般编程问题

下载此实例

开发语言：Others
实例大小：65.21M
下载次数：5
浏览次数：44
发布时间：2024-07-02
实例类别：一般编程问题
发布人：chenxiaolan
文件格式：.zip
所需积分：2

实例介绍

[下载地址]

【实例简介】

RLCode团队呈现了一系列简洁明了的强化学习算法示例。从基础知识到深度强化学习，该存储库提供了易于阅读的代码示例。每个算法都有一个文件。

请随意创建Pull Request或提出问题！

依赖关系

Python 3.5
Tensorflow 1.0.0
Keras
numpy
pandas
matplot
pillow
Skimage
h5py

安装要求：

pip install -r requirements.txt

【实例截图】
【核心代码】
文件清单
└── reinforcement-learning-2fe6984da684c3f64a8d09d1718dbac9330aecea
    ├── 1-grid-world
    │   ├── 1-policy-iteration
    │   │   ├── environment.py
    │   │   └── policy_iteration.py
    │   ├── 2-value-iteration
    │   │   ├── environment.py
    │   │   └── value_iteration.py
    │   ├── 3-monte-carlo
    │   │   ├── environment.py
    │   │   └── mc_agent.py
    │   ├── 4-sarsa
    │   │   ├── environment.py
    │   │   └── sarsa_agent.py
    │   ├── 5-q-learning
    │   │   ├── environment.py
    │   │   └── q_learning_agent.py
    │   ├── 6-deep-sarsa
    │   │   ├── deep_sarsa_agent.py
    │   │   ├── environment.py
    │   │   ├── save_graph
    │   │   │   └── deep_sarsa_trained.png
    │   │   └── save_model
    │   │       └── deep_sarsa_trained.h5
    │   ├── 7-reinforce
    │   │   ├── environment.py
    │   │   ├── reinforce_agent.py
    │   │   ├── save_graph
    │   │   │   └── reinforce_trained.png
    │   │   └── save_model
    │   │       └── reinforce_trained.h5
    │   ├── gridworld_changing.png
    │   ├── gridworld.png
    │   ├── img
    │   │   ├── circle.png
    │   │   ├── down.png
    │   │   ├── left.png
    │   │   ├── rectangle.png
    │   │   ├── right.png
    │   │   ├── triangle.png
    │   │   └── up.png
    │   └── README.md
    ├── 2-cartpole
    │   ├── 1-dqn
    │   │   ├── cartpole_dqn.py
    │   │   ├── cartpole_only_per.py
    │   │   ├── save_graph
    │   │   │   └── Cartpole_DQN.png
    │   │   ├── save_model
    │   │   │   └── cartpole_dqn.h5
    │   │   └── SumTree.py
    │   ├── 2-double-dqn
    │   │   ├── cartpole_ddqn.py
    │   │   ├── save_graph
    │   │   │   └── cartpole_ddqn.png
    │   │   └── save_model
    │   │       └── cartpole_ddqn.h5
    │   ├── 3-reinforce
    │   │   ├── cartpole_reinforce.py
    │   │   ├── save_graph
    │   │   │   └── cartpole_reinforce.png
    │   │   └── save_model
    │   │       └── cartpole_reinforce.h5
    │   ├── 4-actor-critic
    │   │   ├── cartpole_a2c.py
    │   │   ├── save_graph
    │   │   │   └── cartpole_a2c.png
    │   │   └── save_model
    │   │       ├── cartpole_actor.h5
    │   │       └── cartpole_critic.h5
    │   ├── 5-a3c
    │   │   ├── cartpole_a3c.py
    │   │   └── save_model
    │   │       ├── Cartpole_A3C_actor.h5
    │   │       └── Cartpole_A3C_critic.h5
    │   ├── cartpole.png
    │   ├── LICENSE
    │   └── README.md
    ├── 3-atari
    │   ├── 1-breakout
    │   │   ├── breakout_a3c.py
    │   │   ├── breakout_ddqn.py
    │   │   ├── breakout_dqn.py
    │   │   ├── breakout_dueling_ddqn.py
    │   │   ├── play_a3c_model.py
    │   │   ├── play_dqn_model.py
    │   │   ├── save_model
    │   │   │   ├── breakout_a3c_1_actor.h5
    │   │   │   ├── breakout_a3c_1_critic.h5
    │   │   │   ├── breakout_a3c_2_actor.h5
    │   │   │   ├── breakout_a3c_2_critic.h5
    │   │   │   ├── breakout_a3c_3_actor.h5
    │   │   │   ├── breakout_a3c_3_critic.h5
    │   │   │   ├── breakout_a3c_4_actor.h5
    │   │   │   ├── breakout_a3c_4_critic.h5
    │   │   │   ├── breakout_a3c_5_actor.h5
    │   │   │   ├── breakout_a3c_5_critic.h5
    │   │   │   ├── breakout_dqn_1.h5
    │   │   │   ├── breakout_dqn_2.h5
    │   │   │   ├── breakout_dqn_3.h5
    │   │   │   ├── breakout_dqn_4.h5
    │   │   │   ├── breakout_dqn_5.h5
    │   │   │   └── breakout_dqn.h5
    │   │   └── summary
    │   │       ├── breakout_a3c
    │   │       │   └── events.out.tfevents.1497264638
    │   │       └── breakout_dqn
    │   │           └── events.out.tfevents.1496968668.young-System-Product-Name
    │   ├── 2-pong
    │   │   ├── assets
    │   │   │   ├── pg.gif
    │   │   │   └── score.png
    │   │   ├── pong_a3c.py
    │   │   ├── pong_reinforce.py
    │   │   ├── README.md
    │   │   └── save_model
    │   │       └── pong_reinforce.h5
    │   └── LICENSE
    ├── 4-gym
    │   └── 1-mountaincar
    │       ├── mountaincar_dqn.py
    │       └── save_model
    │           └── MountainCar_DQN.h5
    ├── images
    │   └── Reinforcement-Learning.png
    ├── LICENSE
    ├── README.md
    ├── requirements.txt
    └── wiki
        ├── how-to-windows.md
        ├── img
        │   ├── how-to-windows.png
        │   ├── link-env-with-pychar-1.png
        │   ├── link-env-with-pychar-2.png
        │   └── link-env-with-pychar.png
        ├── install_guide_osx ubuntu.md
        └── rlcode_image
            ├── cartpole_exam.png
            ├── console_hello_world.png
            ├── default_config.png
            ├── file_setting.png
            ├── hello_world_ubuntu.png
            ├── openai_github.png
            ├── project_interpreter.png
            ├── pycham_new_project.png
            ├── pycharm_community.png
            ├── pycharm_drag.png
            ├── pycharm_init.png
            ├── python3_terminal.jpg
            ├── python_download.png
            ├── python_installed.png
            ├── python_intalled.png
            ├── rl_book_hello_world.png
            ├── rl_book_project.png
            ├── rl_book_venv.png
            ├── rl_book_virtualenv.png
            ├── rlcode_book_directory.png
            ├── rlcode_project.png
            ├── run_hello_world.png
            ├── sh_pycharm.sh.png
            └── terminal_rlcode_book.png

45 directories, 116 files

标签：

实例下载地址