Single Agent Actor-Critic

We implement and train a single-agent actor-critic agent based on the CNN+LSTM+Actor/Critic architecture.

We perform hyperparameter optimization on 4 key parameters:

In addition we benchmark our agent against A3C 1,4 and 16 agents implemented by ikostrikov:

An overview of our results:

Pong
Our agent achieves:

Breakout
Our agent achieves:

Name		Name	Last commit message	Last commit date
Latest commit History 39 Commits
.ipynb_checkpoints		.ipynb_checkpoints
plots		plots
report		report
results		results
saved_models		saved_models
video		video
.gitignore		.gitignore
AC-LSTM.ipynb		AC-LSTM.ipynb
README.md		README.md
ac_lstm_model.py		ac_lstm_model.py
actor_critic.py		actor_critic.py
actor_critic_lstm (v1).py		actor_critic_lstm (v1).py
actor_critic_lstm-batch.py		actor_critic_lstm-batch.py
actor_critic_lstm-episode.py		actor_critic_lstm-episode.py
actor_critic_lstm.py		actor_critic_lstm.py
actor_critic_model.py		actor_critic_model.py
gen_charts.ipynb		gen_charts.ipynb
plot.py		plot.py
record.py		record.py
utils.py		utils.py
visualize.py		visualize.py
visualize_lstm.py		visualize_lstm.py

Provide feedback