Skip to content

Latest commit

 

History

History
7 lines (4 loc) · 468 Bytes

230311 Regularized Vector Quantization for Tokenized Image Synthesis.md

File metadata and controls

7 lines (4 loc) · 468 Bytes

https://arxiv.org/abs/2303.06424

Regularized Vector Quantization for Tokenized Image Synthesis (Jiahui Zhang, Fangneng Zhan, Christian Theobalt, Shijian Lu)

vq-vae에 대한 regularization으로 codebook collapse를 방지하는 방법에 대한 결과군요. 토큰 분포가 uniform하도록 하는 regularization + stochastic sampling된 토큰과 deterministic하게 뽑힌 토큰을 마스크로 결합해서 같이 학습에 사용하는 접근이군요.

#vq