https://arxiv.org/abs/2011.14027
General Multi-label Image Classification with Transformers (Jack Lanchantin, Tianlu Wang, Vicente Ordonez, Yanjun Qi)
트랜스포머를 사용한 이미지 multilabel classification. masked label을 예측하도록 하는 방식. 레이블이 부분적으로 주어졌을 때 혹은 추가적인 레이블이 주어졌을 때 이 레이블 정보를 사용해서 출력 결과를 개선할 수 있는 것을 목표로 설정. 흥미로운 과제인 듯.
#vision_transformer