Skip to content

Latest commit

 

History

History
9 lines (5 loc) · 561 Bytes

230215 PRedItOR.md

File metadata and controls

9 lines (5 loc) · 561 Bytes

https://arxiv.org/abs/2302.07979

PRedItOR: Text Guided Image Editing with Diffusion Prior (Hareesh Ravi, Sachin Kelkar, Midhun Harikumar, Ajinkya Kale)

LDM 기반 이미지 에디팅이군요. 일단 이미지의 clip embedding에 prior를 사용해서 텍스트 에디팅을 적용한 뒤 원 이미지를 적절한 강도의 reverse ddim으로 latent로 전환해서 다시 샘플링하는 방식이군요.

요즘 이런 연구의 평가 기준은 커뮤니티에 받아들여질지 아닐지가 아닐까 하는 생각도 듭니다.

#image_editing #ddpm