https://arxiv.org/abs/2112.10752
High-Resolution Image Synthesis with Latent Diffusion Models (Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser, Björn Ommer)
트랜스포머를 길들이시던 분들이 ddpm을 길들여보셨군요. 오토인코더의 latent space에 ddpm을 올린 형태의 모델이네요. 이분들도 진짜 취향 확고하네요.
#vae #vq #ddpm