USPTO (4) 썸네일형 리스트형 One Strike, You’re Out: Detecting Markush Structures in Low Signal-to-Noise Ratio Images AbstractMarkush 구조를 분류하기 위한 방법을 테스트Macro F1 comparisonnfixed-feature extraction (0.701 ± 0.052)end-to-end CNN (0.928±0.035)IntroductionOptical Chemical Structure Recognition (OCSR) : Chemical Structural Formulae (CSF)를 이미지로부터 기계언어로 변환하는 것Incomplete CSF (Markush)를 필터하는 것으로 OCSR 성능을 향상시킬 수 있다CSF에서 다양함을 표현학히 위한 기호나 구조를 _Markush Indicator_라고 하며, 일반적인 표현 방식이 없다Markush 인식이 어려운 이유이미지 별로 픽셀 크기가 다름하나의 Ma.. The Harvard USPTO Patent Dataset:A Large-Scale, Well-Structured, and Multi-Purpose Corpus of Patent Applications Abstract The Harard USPTO Patent Dataset(HUPD)를 제안 2004년부터 2018년까지의 USPTO 특허 4.5M 특허 문서 특허 출원 버전이 포함됨 (최초) 다양한 메타데이터 제공 Patent decision의 이진분류 작업을 제안 위 작업에 대한 concept shift에 대한 연구 가능 Multi-class classification, language modeling, 그리고 요약이 가능하며 시연 1 Introduction 지난 20년 동안 미국 특허상표청(USPTO)에 제출된 연간 특허 출원 건수는 거의 두 배로 늘어났다. 2020 회계연도에만 USPTO는 계속 심사 요청을 포함해 650,000건 이상의 특허 출원을 접수했다. Table. 1에서처럼 특허 연구를 위.. A Horizontal Patent Test Collection * Test Collection available (restricted) Abstract 여섯 특허청으로 부터의 multimodal과 multilingual을 포함하는 public 특허 데이터의 필요성이 있다. 새로운 특허 데이터는 기존의 vertical (몇 년 동안의 단일 domain 또는 단일 특허청 범위) 특허 데이터를 보완한다. 새로운 데이터는 horizontal (2년간의 상대적으로 짧은 기간 동안 주요 특허청으로부터 모든 기술적 도메인을 포함) 하다. 현재 여러 테스트 컬렉션에 분산되어 있는 문서를 통합하는 것 외에도 유럽, 미국, 일본, 중국의 문서를 보완하기 위해 최초로 한국어 문서를 제공한다. Introduction 자연과학과 달리 Natural Language Processing(NL.. (2022) 3rd Workshop on Patent Text Mining and Semantic Technologies PatentSemTech 2022 Foreword Information Extraction End-to-End Chemical Reaction Extraction from Patents Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A Akhondi, Christian Druckenbrodt, Camilo Thorne, Zenan Zhai and Karin Verspoor Optimizing BERT-based reference mining from patents Zahra Abbasiantaeb, Suzan Verberne and Jian Wang Classification An Ensemble Architecture of Classifiers.. 이전 1 다음