tensowflow_ddpg

Deep Deterministic Policy Gradient

DDPG method is RL method that utilizes DPG Theorem, that can handle continuous action space. This implementation depends on Tensowflow and this RL model is experimented on aigym. Following papers are referred when implementing this model.

How to use

git clone https://github.com/sykwer/tensorflow_ddpg.git
cd tensowflow_ddpg
python main.py

Experiment

Experiment on InvertedPendulum-v2

(episode - total reward)

Resources

If you can conprehend Japanese article, refer to following articles! I have written several articles to understand DDPG theorem.

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
images		images
.gitignore		.gitignore
README.md		README.md
actor_net.py		actor_net.py
critic_net.py		critic_net.py
ddpg_agent.py		ddpg_agent.py
main.py		main.py
ou_noise.py		ou_noise.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

tensowflow_ddpg

Deep Deterministic Policy Gradient

How to use

Experiment

Resources

About

Releases

Packages

Languages

sykwer/tensorflow_ddpg

Folders and files

Latest commit

History

Repository files navigation

tensowflow_ddpg

Deep Deterministic Policy Gradient

How to use

Experiment

Resources

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages