ml-papers/papers/2020/201204 Nimble.md at main · rosinality/ml-papers · GitHub

https://arxiv.org/abs/2012.02732

Nimble: Lightweight and Parallel GPU Task Scheduling for Deep Learning (Woosuk Kwon, Gyeong-In Yu, Eunji Jeong, Byung-Gon Chun)

gpu 스케쥴링 최적화로 학습/추론 속도 개선. 추론 속도에서 tensorrt보다 더 빠르다는 것이 인상적. 파이토치 기반인데 파이토치에 앞으로 이런 최적화가 도입될 수 있을지도?

#computation