reinforcement_learning_tutorial

A repository for studing reinforcement learning.
All algorithm descriptions are available at the following link.
All concept descriptions are available at the following link.

No	RL	Action Space	Simulation	Code	Note
1	Q-Learning	Descrete	Cartpole	tutorial_1_1_q_learning.py
		Descrete	Cartpole	tutorial_1_2_q_learning_greedy.py	$\epsilon$-greedy
2	DQN	Descrete	Cartpole	tutorial_2_DQN.py
3	REINFORCE	Descrete	Cartpole	tutorial_3_REINFORCE.py
4	Actor-Critic	Descrete	Cartpole	tutorial_4_1_actor_critic.py
		Descrete	Cartpole	tutorial_4_2_actor_critic_share.py	actor and critic share the network
5	A2C	Descrete	Cartpole	tutorial_5_A2C.py
6	PPO	Descrete	Cartpole	tutorial_6_1_PPO.py
		Descrete	Cartpole	tutorial_6_2_PPO_share.py	actor and critic share the network
		Continous	Half-Cheetah	tutorial_continuos_1_1_PPO.py
		Continous	Half-Cheetah	tutorial_continuos_1_2_PPO.py	actor and critic share the network
		Continous	Half-Cheetah	tutorial_continuos_1_3_PPO_multi.py	share network / multiprocessing
		Continous	Car-Racing	tutorial_continuos_1_4_PPO_multi.py	CNN / share network / multiprocessing
7	SAC	Continous	Half-Cheetah	tutorial_continuos_2_1_SAC.py
		Continous	Car-Racing	tutorial_continuos_2_2_SAC.py	CNN

2. Setup

1. Download tutorial code

mkdir ~/reinforcement_learning_tutorial
git clone https://github.com/HJS-HJS/reinforcement_learning_tutorial.git reinforcement_learning_tutorial

2. Install required library

sudo apt-get install patchelf

3. Install required python library

cd ~/reinforcement_learning_tutorial
pip3 install -r requirements.txt

4. Install MUJOCO 2.1.0

Download the "mujoco210-linux-x86_64.tar.gz" from link

cd ~/Downloads
tar -zxvf mujoco210-linux-x86_64.tar.gz
mkdir ~/.mujoco
cp -r mujoco210 ~/.mujoco/
rm -rf mujoco210 mujoco210-linux-x86_64.tar.gz
echo 'LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/rise/.mujoco/mujoco210/bin:/usr/lib/nvidia' >> ~/.bashrc

Change the variable name from "solver_iter" to "solver_niter"

gedit {path_to_your_gym_library}/envs/mujoco/mujoco_rendering.py

from

    self.add_overlay(
        bottomleft, "Solver iterations", str(self.data.solver_iter + 1)
    )

to

    self.add_overlay(
        bottomleft, "Solver iterations", str(self.data.solver_niter + 1)
    )

3. Before Start

1. Check environments

Check if CUDA is properly installed

python3 ~/reinforcement_learning_tutorial/before_start_1_1_check_cuda.py

Check if cartpole is running

python3 ~/reinforcement_learning_tutorial/before_start_1_2_start_gym.py

2. Simple policy

An example of moving a cartpole with an unchanging policy.

python3 ~/reinforcement_learning_tutorial/before_start_2_start_policy.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

reinforcement_learning_tutorial

Table of Contents

1. Code Running

2. Setup

1. Download tutorial code

2. Install required library

3. Install required python library

4. Install MUJOCO 2.1.0

3. Before Start

1. Check environments

2. Simple policy

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 165 Commits
Summary		Summary
model		model
utils		utils
.gitignore		.gitignore
README.md		README.md
before_start_1_1_check_cuda.py		before_start_1_1_check_cuda.py
before_start_1_2_start_gym.py		before_start_1_2_start_gym.py
before_start_2_simple_policy.py		before_start_2_simple_policy.py
requirements.txt		requirements.txt
tutorial_1_1_q_learning.py		tutorial_1_1_q_learning.py
tutorial_1_2_q_learning_greedy.py		tutorial_1_2_q_learning_greedy.py
tutorial_2_DQN.py		tutorial_2_DQN.py
tutorial_3_REINFORCE.py		tutorial_3_REINFORCE.py
tutorial_4_1_actor_critic.py		tutorial_4_1_actor_critic.py
tutorial_4_2_actor_critic_share.py		tutorial_4_2_actor_critic_share.py
tutorial_5_A2C.py		tutorial_5_A2C.py
tutorial_6_1_PPO.py		tutorial_6_1_PPO.py
tutorial_6_2_PPO_share.py		tutorial_6_2_PPO_share.py
tutorial_continuos_1_1_PPO.py		tutorial_continuos_1_1_PPO.py
tutorial_continuos_1_2_PPO.py		tutorial_continuos_1_2_PPO.py
tutorial_continuos_1_3_PPO_multi.py		tutorial_continuos_1_3_PPO_multi.py
tutorial_continuos_1_4_PPO_multi.py		tutorial_continuos_1_4_PPO_multi.py
tutorial_continuos_2_1_SAC.py		tutorial_continuos_2_1_SAC.py
tutorial_continuos_2_2_SAC.py		tutorial_continuos_2_2_SAC.py
tutorial_continuos_2_3_SAC_multi.py		tutorial_continuos_2_3_SAC_multi.py
tutorial_continuos_2_4_SAC_multi.py		tutorial_continuos_2_4_SAC_multi.py

Folders and files

Latest commit

History

Repository files navigation

reinforcement_learning_tutorial

Table of Contents

1. Code Running

2. Setup

1. Download tutorial code

2. Install required library

3. Install required python library

4. Install MUJOCO 2.1.0

3. Before Start

1. Check environments

2. Simple policy

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages