classification (3) 썸네일형 리스트형 IPC prediction of patent documents using neural network with attention for hierarchical structure Abstract 70,000 IPC를 분류에는 많은 비용이 소모된다. 특허를 ML로 분류하려는 시도가 있었지만 큰 사이즈로 인해 필요한 메모리가 많아 입력 정보가 제한된다. IPC의 계층적 구조와 새로운 decoder 아키텍처를 제안한다. 1 Introduction 매년 전 세계에서 3M 개의 특허가 출원되며 하나의 특허를 검토하는데 6개월 이상의 시간이 소요된다. 각 특허는 international patent classification (IPC)를 몇 가지 부여 받으며 적절한 IPC를 부여받는 것이 특허 등록에 영향을 미친다. IPC 예측 모델을 개발한다면 조사관들의 부담을 줄이면서 적절한 조사관에게 특허가 할당될 수 있으며 유사 특허 검색에도 용이할 것이다. IPC는 계층적 구조이기 때문에 해당 예.. Evaluating Out-of-Distribution Performance on Document Image Classifier Abstract RVL-CDIP는 좋은 문서 분류 benchmark지만 out-of-distribution 문서에 대한 평가가 포함되어 있지 않다. 따라서 본 논문에서는 새로운 out-of-distribution benchmark를 소개한다. 새 데이터에는 두 종류의 out-of-distribution 문서가 추가되었다. RVL-CDIP-O: 16개의 domain 에 속하지 않음 RVL-CDIP-N: 16개 안에 속하지만 새로운 분포에 속함 기존의 RVL-CDIP 성능대비 새로운 benchmark를 기준으로 accuracy는 15-30% 떨어졌다. 새로운 문서 분류 benchmark는 문서 분류기의 out-of-distribution 성능을 분석할 수 있다. Introduction RVL-CDIP는 si.. (2022) 3rd Workshop on Patent Text Mining and Semantic Technologies PatentSemTech 2022 Foreword Information Extraction End-to-End Chemical Reaction Extraction from Patents Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A Akhondi, Christian Druckenbrodt, Camilo Thorne, Zenan Zhai and Karin Verspoor Optimizing BERT-based reference mining from patents Zahra Abbasiantaeb, Suzan Verberne and Jian Wang Classification An Ensemble Architecture of Classifiers.. 이전 1 다음