https://arxiv.org/abs/2206.10789
Scaling Autoregressive Models for Content-Rich Text-to-Image Generation (Jiahui Yu, Yuanzhong Xu, Jing Yu Koh, Thang Luong, Gunjan Baid, Zirui Wang, Vijay Vasudevan, Alexander Ku, Yinfei Yang, Burcu Karagol Ayan, Ben Hutchinson, Wei Han, Zarana Parekh, Xin Li, Han Zhang, Jason Baldridge, Yonghui Wu)
구글 퍼슨들이 이미지 생성 모델을 하나 더 만들었군요. 놀랍게도(?) 이쪽은 보다 전통적인 vq-vae + autoregressive 모델입니다. 모델 크기 증가에 따라 이미지 생성 결과가 완전히 달라지는 것이 흥미롭네요.
#autoregressive_model #image_generation