HRL_taxi

MAXQ_0:

Hierarchical reinforcement learning algorithm from "Hierarchical Reinforcement Learning with the MAXQ Value Function Decomposition" by T. G. Dietterich for solving Taxi-v3 environment from https://gym.openai.com/envs/Taxi-v3/