-
Notifications
You must be signed in to change notification settings - Fork 4
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Flax #41
Conversation
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Okey, czyli widzę że rozwiązałęś sprawę z cloudpickle przez notkę w dokumentacji. Spoko, popieram.
Druga sprawa to widziałem że jednak się zdecydowałeś na aktywację tangensem hip. i zaznaczyłeś komentarzem że to się różni od oryginału. Myżlę że tak jest najlepiej. A jak to wpłynęło na wyniki?
Tak, zdecydowałem się na tanh, bo dzięki temu DDPG działa za każdym razem (nie występuje ten problem z "uciekaniem" wyjścia sieci poza zakres [0, 6]). Wyniki są dobre (prawie takie same, jak poprzednio), więc chyba ostatecznie jest sukces i dlatego zostawiłem tak 😉 |
agents.deep.QLearning
toDQN
andagents.deep.DQN
toDDQN
agents
toutils
(it is not an agent, rather a core for some algorithms)