https://arxiv.org/abs/2111.00210
Mastering Atari Games with Limited Data (Weirui Ye, Shaohuai Liu, Thanard Kurutach, Pieter Abbeel, Yang Gao)
muzero의 발전이군요. 아타리를 2시간 분량의 게임 플레이만으로 학습해냈습니다.
#reinforcement_learning
https://arxiv.org/abs/2111.00210
Mastering Atari Games with Limited Data (Weirui Ye, Shaohuai Liu, Thanard Kurutach, Pieter Abbeel, Yang Gao)
muzero의 발전이군요. 아타리를 2시간 분량의 게임 플레이만으로 학습해냈습니다.
#reinforcement_learning