ml-papers/papers/2023/230511 Region-Aware Pretraining for Open-Vocabulary Object Detection with Vision Transformers.md at main · rosinality/ml-papers · GitHub

https://arxiv.org/abs/2305.07011

Region-Aware Pretraining for Open-Vocabulary Object Detection with Vision Transformers (Dahun Kim, Anelia Angelova, Weicheng Kuo)