clustering (1) 썸네일형 리스트형 Clean your desk! Transformers for unsupervised clustering of document images Abstract 문서 분류를 위해 Clustering 을 목표로 한다 Multi-modal Transformer-based encoder : LayoutLM과 LayoutLMv2 사용 RVL-CDIP 문서, SROIE 영수증 및 machine learning 논문에 테스트 수행 텍스트가 많은 문서에 LayoutLM이 이점이 있음에도 LayoutLMv2가 항상 성능을 상회한다 [CLS] 토큰이 Clustering에 항상 최선의 representation은 아니다 1. Introduction 문서 분류를 돕기위해 unsupervised document clustering을 수행했다. 이는 문서 분류와 다르게 라벨이 필요없다. Document understanding은 본질적으로 multimodal이며 강력한.. 이전 1 다음