Reinforcement Learning Exercises

Solutions to RL exercises proposed in the git repo by Denny Britz.

Dynamic Programming

Policy Evaluation
Policy Iteration
Value Iteration

Monte Carlo methods

Monte Carlo Prediction
On-policy Monte Carlo Control with e-greedy policy
Off-policy Monte Carlo Control with Weighted Importance Sampling

Temporal Difference Learning

SARSA (On-policy TD control)
Q-learning (Off-policy TD control)

Function approximation

Q-learning with linear function approximation

Deep Q Learning

Deep Q learning
Double Deep Q learning

Policy Gradient

REINFORCE with baseline
Actor-Critic with baseline
Actor-Critic with baseline for continuous action space
Asynchornous Advantage Actor-Critic (A3C)

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
DP		DP
FA		FA
MC		MC
TD		TD
lib		lib
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement Learning Exercises

Dynamic Programming

Monte Carlo methods

Temporal Difference Learning

Function approximation

Deep Q Learning

Policy Gradient

About

Releases

Packages

Languages

rahulptel/RL-Solutions

Folders and files

Latest commit

History

Repository files navigation

Reinforcement Learning Exercises

Dynamic Programming

Monte Carlo methods

Temporal Difference Learning

Function approximation

Deep Q Learning

Policy Gradient

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages