https://arxiv.org/abs/2211.14108
3DDesigner: Towards Photorealistic 3D Object Generation and Editing with Text-guided Diffusion Models (Gang Li, Heliang Zheng, Chaoyue Wang, Chang Li, Changwen Zheng, Dacheng Tao)
photorealistic이라는 타이틀이 걸려서 한 번 살펴봤습니다. nerf 학습 데이터와 text가 pair된 데이터가 있다고 할 때 nerf를 text conditioning 해서 학습시키고, nerf에서 생성된 multi view 이미지들을 pair로 해서 text condition된 diffusion에 입력해 view consistency와 text 기반 편집을 가능하게 하는 방식이네요.
#text2img #3d_generative_model