https://arxiv.org/abs/2106.00676
Incorporating Visual Layout Structures for Scientific Text Classification (Zejiang Shen, Kyle Lo, Lucy Lu Wang, Bailey Kuehl, Daniel S. Weld, Doug Downey)
문서 위에 올리는 모델에 텍스트 박스 좌표 정보 뿐만 아니라 텍스트 그룹 같은 레이아웃 정보도 결합시켜주면 더 좋다는 결과. 사실 문제는 레이아웃 정보를 어떻게 추출할 것인가가 아닐까 싶긴 합니다...
#layout