https://arxiv.org/abs/2002.05235
Image-to-Image Translation with Text Guidance (Bowen Li, Xiaojuan Qi, Philip H. S. Torr, Thomas Lukasiewicz)
텍스트로 이미지 생성 과정을 조절하는 모델. segmentation mask를 객체에 대한 기본 정보로 활용하고 텍스트 정보를 결합해서 multi resolution에서 refine하는 접근. (SinGAN?)
#multimodal #multimodal_generation #gan #img2img