https://arxiv.org/abs/2302.07979
PRedItOR: Text Guided Image Editing with Diffusion Prior (Hareesh Ravi, Sachin Kelkar, Midhun Harikumar, Ajinkya Kale)
LDM 기반 이미지 에디팅이군요. 일단 이미지의 clip embedding에 prior를 사용해서 텍스트 에디팅을 적용한 뒤 원 이미지를 적절한 강도의 reverse ddim으로 latent로 전환해서 다시 샘플링하는 방식이군요.
요즘 이런 연구의 평가 기준은 커뮤니티에 받아들여질지 아닐지가 아닐까 하는 생각도 듭니다.
#image_editing #ddpm