Skip to content

Latest commit

 

History

History
7 lines (4 loc) · 405 Bytes

201204 Nimble.md

File metadata and controls

7 lines (4 loc) · 405 Bytes

https://arxiv.org/abs/2012.02732

Nimble: Lightweight and Parallel GPU Task Scheduling for Deep Learning (Woosuk Kwon, Gyeong-In Yu, Eunji Jeong, Byung-Gon Chun)

gpu 스케쥴링 최적화로 학습/추론 속도 개선. 추론 속도에서 tensorrt보다 더 빠르다는 것이 인상적. 파이토치 기반인데 파이토치에 앞으로 이런 최적화가 도입될 수 있을지도?

#computation