Releases · takuseno/d3rlpy · GitHub

10 Aug 23:54

takuseno

Release version v0.2

support model-based algorithm
- Model-based Offline Policy Optimization
support data augmentation (for image observation)
- Data-reguralized Q-learning
a lot of improvements
- more dataset statistics
- more options to customize neural network architecture
- optimize default learning rates
- etc

Assets 2

31 Jul 15:40

takuseno

First release!

online algorithms
- Deep Q-Network (DQN)
- Double DQN
- Deep Deterministic Policy Gradients (DDPG)
- Twin Delayed Deep Deterministic Policy Gradients (TD3)
- Soft Actor-Critic (SAC)
data-driven algorithms
- Batch-Constrained Q-leearning (BCQ)
- Bootstrapping Error Accumulation Reduction (BEAR)
- Conservative Q-Learning (CQL)
Q functions
- mean
- Quantile Regression
- Implicit Quantile Network
- Fully-parametrized Quantile Function (experimental)

Assets 2