Skip to content

Latest commit

 

History

History
7 lines (4 loc) · 648 Bytes

210922 Pix2seq.md

File metadata and controls

7 lines (4 loc) · 648 Bytes

https://arxiv.org/abs/2109.10852

Pix2seq: A Language Modeling Framework for Object Detection (Ting Chen, Saurabh Saxena, Lala Li, David J. Fleet, Geoffrey Hinton)

detr 식의 매칭이 반드시 필요한 것인가 하는 의문이 드는 시점에 필요하지 않다는 것을 보여주는 결과가 나왔군요. autoregressive 모델을 사용하면 시퀀스 내의 순서 자체가 중요하지 않다는 것까지 보였습니다. end2end deep learning의 잠재력을 좀 더 믿었어야 했던 것으로. (물론 autoregressive 샘플링보다는 매칭 쪽이 빠르긴 하겠지만요.)

#object_detection #detr #autoregressive_model