https://arxiv.org/abs/2303.06424
Regularized Vector Quantization for Tokenized Image Synthesis (Jiahui Zhang, Fangneng Zhan, Christian Theobalt, Shijian Lu)
vq-vae에 대한 regularization으로 codebook collapse를 방지하는 방법에 대한 결과군요. 토큰 분포가 uniform하도록 하는 regularization + stochastic sampling된 토큰과 deterministic하게 뽑힌 토큰을 마스크로 결합해서 같이 학습에 사용하는 접근이군요.
#vq