https://arxiv.org/abs/2302.13848
ELITE: Encoding Visual Concepts into Textual Embeddings for Customized Text-to-Image Generation (Yuxiang Wei, Yabo Zhang, Zhilong Ji, Jinfeng Bai, Lei Zhang, Wangmeng Zuo)
text2img에 사용할 수 있도록 이미지를 텍스트 임베딩으로 최적화 없이 변환하는 인코더 개발. 다만 object mask가 사용되는 것으로 보이네요.
#text2img #ddpm