Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Flax #41

Merged
merged 16 commits into from
Feb 9, 2024
Merged

Flax #41

merged 16 commits into from
Feb 9, 2024

Conversation

m-wojnar
Copy link
Owner

@m-wojnar m-wojnar commented Feb 5, 2024

  • Migrate from haiku to flax
  • Fix a period of incorrect updates between the start of training and the buffer filling
  • Code refactor
  • Rename agents.deep.QLearning to DQN and agents.deep.DQN to DDQN
  • Move particle filter from agents to utils (it is not an agent, rather a core for some algorithms)

@m-wojnar m-wojnar requested a review from Wotaker February 5, 2024 11:40
Copy link
Collaborator

@Wotaker Wotaker left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Okey, czyli widzę że rozwiązałęś sprawę z cloudpickle przez notkę w dokumentacji. Spoko, popieram.

Druga sprawa to widziałem że jednak się zdecydowałeś na aktywację tangensem hip. i zaznaczyłeś komentarzem że to się różni od oryginału. Myżlę że tak jest najlepiej. A jak to wpłynęło na wyniki?

@m-wojnar
Copy link
Owner Author

m-wojnar commented Feb 9, 2024

Druga sprawa to widziałem że jednak się zdecydowałeś na aktywację tangensem hip. i zaznaczyłeś komentarzem że to się różni od oryginału. Myżlę że tak jest najlepiej. A jak to wpłynęło na wyniki?

Tak, zdecydowałem się na tanh, bo dzięki temu DDPG działa za każdym razem (nie występuje ten problem z "uciekaniem" wyjścia sieci poza zakres [0, 6]). Wyniki są dobre (prawie takie same, jak poprzednio), więc chyba ostatecznie jest sukces i dlatego zostawiłem tak 😉

@m-wojnar m-wojnar merged commit 4e33f09 into main Feb 9, 2024
5 checks passed
@m-wojnar m-wojnar deleted the flax branch February 9, 2024 19:31
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants