https://arxiv.org/abs/2005.08931
Joint Multi-Dimension Pruning (Zechun Liu, Xiangyu Zhang, Zhiqiang Shen, Zhe Li, Yichen Wei, Kwang-Ting Cheng, Jian Sun)
요즘 종종 나오는 네트워크 입력 크기, 채널 수, 깊이 동시 깎기. 네트워크 구조에 따른 계산 비용을 regularizer로 두고 이 비용 함수에 대한 그래디언트를 log derivative trick으로 계산하는 방식. (RL스럽게)
#pruning