GitHub - nabilblk/rl-sandbox: My sandbox for Reinforcement Learning

Prérequis :

Gym 0.9.3
Tensorflow
Keras
Keras-rl

Installation de Gym :

sudo apt-get install -y python3-numpy python3-dev python3-pip cmake zlib1g-dev libjpeg-dev xvfb libav-tools xorg-dev python-opengl libboost-all-dev libsdl2-dev swig
cd ~
git clone https://github.com/openai/gym.git
cd gym
sudo pip3 install -e '.[all]'

Experiment 1

Taxi-v2 : Example .
Random Steps .
Simple Learning Formula :

Experiment 2

More complex environement Lunarlander-v2
Using keras-rl for it's simplicity .

DL model :

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
flatten_1 (Flatten)          (None, 8)                 0         
_________________________________________________________________
dense_1 (Dense)              (None, 16)                    144       
_________________________________________________________________
activation_1 (Activation)    (None, 16)                0         
_________________________________________________________________
dense_2 (Dense)              (None, 16)                272       
_________________________________________________________________
activation_2 (Activation)    (None, 16)                0         
_________________________________________________________________
dense_3 (Dense)              (None, 16)                272       
_________________________________________________________________
activation_3 (Activation)    (None, 16)                0         
_________________________________________________________________
dense_4 (Dense)              (None, 4)                 68        
_________________________________________________________________
activation_4 (Activation)    (None, 4)                 0         
=================================================================
Total params: 756
Trainable params: 756
Non-trainable params: 0
_________________________________________________________________

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.idea		.idea
assets		assets
experiments1		experiments1
experiments2		experiments2
to_delete		to_delete
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Prérequis :

Installation de Gym :

Experiment 1

Experiment 2

Lectures :

About

Releases

Packages

Languages

nabilblk/rl-sandbox

Folders and files

Latest commit

History

Repository files navigation

Prérequis :

Installation de Gym :

Experiment 1

Experiment 2

Lectures :

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages