https://arxiv.org/abs/2012.02732
Nimble: Lightweight and Parallel GPU Task Scheduling for Deep Learning (Woosuk Kwon, Gyeong-In Yu, Eunji Jeong, Byung-Gon Chun)
gpu 스케쥴링 최적화로 학습/추론 속도 개선. 추론 속도에서 tensorrt보다 더 빠르다는 것이 인상적. 파이토치 기반인데 파이토치에 앞으로 이런 최적화가 도입될 수 있을지도?
#computation