전체 글 (47) 썸네일형 리스트형 Unifying Vision, Text, and Layout for Universal Document Processing Abstract 논문에서 다양한 task 형식에 text, image, layout을 통합하는 foundation Document AI 모델인 Universal Document Processing(UDOP)을 제안한다. UDOP는 text와 image 간의 spatial 상관 관계를 활용하여 uniform representation으로 표현하고, 새로운 Vision-Text-Layout Transformer를 통해 UDOP는 pretrain 및 multi 도메인 downstream task를 prompt-based sequence generation scheme으로 통합한다. UDOP는 혁신적인 self-supervised objectives 와 다양한 label이 지정된 데이터를 사용하여 lebel이 .. Docker image와 container 생성 Docker image 생성사용하고자 하는 환경에 근접한 image를 검색한다. 터미널에서 docker search [키워드] 혹은 docker hub 사이트에서 찾는 방법이 있다. (추천 허브: pytorch/pytorch - Docker Image | Docker Hub)그대로 image를 생성하기 위해서는 아래의 명령어를 terminal에 입력$ docker pull [Image name]:[Tag]검색한 image를 수정하여 사용하려면 scirpt를 만들어서 작업할 수 있다.$ mkdir dockerImg$ vi ./dockerImg/dockerfile파일 내 예시)FROM [Image name]:[Tag]RUN mkdir -p /home/pyWORKDIR /home/py* pip install .. SSH를 통한 서버 접속 SSH를 통한 연결 확인 cmd에서 ipconfig를 통해 IPv4 주소를 확인 후 전달하여 접속하려하는 서버에서 해당 접속이 가능하도록 요청. cmd에서 전달받은 ID/PW, 주소를 통해 ssh명령어를 통해 접속이 가능한지 확인해본다. 아직 key설정을 하지 않았으므로 전달받은 비밀번호가 필요하며 접속하는 쪽의 터미널이 뜨면 정상이다. $ ssh [USER]@[HOSTNAME] -p [PORT] [USER]: 리눅스 사용자(ID)를 입력 [HOSTNAME]: 네트워크 상 접근 가능한 HOSTNAME이나 IP를 지정 [PORT]: 리눅스 서버의 SSH 포트. 22번을 사용한다면 -p 옵션을 생략 SSH key 생성 cmd에서 ssh-keygen 을 통해 key를 생성한다. 생성된 key의 경로는 화면에 .. LayoutLM: Pre-training of Text and Layout for Document Image Understanding Abstract Pre-training 기법은 다양한 NLP 작업에서 최근 몇 년 간 효과적이라고 검증되었다. 그러나 대부분의 NLP application은 text-level에 집중되어있고 문서의 layout이나 style은 무시되었다. 본 논문에서는 LayoutLM을 제안하며, text와 문서 image로부터 scan된 layout 정보의 상호작용을 효과적으로 연결한다. 또한 image feature를 leverage하여 단어의 visual 정보를 모델에 잘 녹였다. 이는 최초로 text와 layout 정보를 single framework에서 document level pre-training을 jointly하게 수행한 몇몇 downstream task에서 비약적인 성능 향상을 보였다. 1. Intro.. 1-2) Elementary of mathmatics 출처: https://www.edwith.org/bayesiandeeplearning/lecture/24678?isDesc=false Probability 학습 목표 Set이 정의되어 있어야 그 위에 Measure를 정의할 수 있고, Measure가 있어야 Probability를 정의할 수 있습니다. 그래서 이전 학습을 통해 Set과 Measure에 대해서 공부해보았습니다. 이제부터는 베이지안 딥러닝을 공부하기에 앞서 꼭 필요한 개념인 Probability에 대해서 구체적으로 공부해보도록 합시다. Keywords 확률(Probability) 표본공간(Sample space) 확률 시행(Random experiment) 확률 질량 함수(Probability mass function) 베이즈정리(Bayes'.. 1-1) Elementary of mathmatics 출처: https://www.edwith.org/bayesiandeeplearning/lecture/24678?isDesc=false Introduction 학습 목표 이번 챕터에서는 Elementary of mathematics에 대해서 소개할 예정입니다. 베이지안 딥러닝에 대해서 구체적으로 공부하기 이전에 확률에 대해서 구체적으로 정의하고, 앞으로 자주보게 될 여러 용어에 대해서 정확하게 이해할 수 있도록 학습하려고 합니다. 본격적으로 학습하기에 앞서 어떤 내용을 배우게 될 지 간략하게 살펴보도록 해요. Keywords Set theory Measure theory Probability Random variable Random process Functional analysis Whats Wrong w.. BEIT: BERT Pre-Training of Image Transformers Abstract BEIT는 Bidirectional Encoder representation form Image Transfomers의 약자로 self-supervised vision representation model이다. NLP에서의 BERT처럼 vision Transformers의 pretrain task로 masked image modeling을 제안한다. 각 image는 image patches (예를들어 16×16 pixels)와 visual tokens 두 가지로 분류된다. 우선, image를 visual token으로 "tokenize"한다. 이후 임의로 몇몇 image patch를 mask한 후 Transformer backbone에 넣어줍니다. Pre-training objective.. Annotated Chemical Patent Corpus: A Gold Standard for Text Mining Abstract 특허 출원이 다루는 화학 및 생물학적 공간을 탐색하는 것은 초기 단계의 의약 화학 활동에서 매우 중요하다. 특허 분석은 화합물 선행 기술에 대한 이해, 신규성 확인, 생물학적 분석의 검증 및 화학적 탐색을 위한 새로운 출발점의 식별을 제공할 수 있다. 전문 큐레이터가 직접 특허에서 화학적 및 생물학적 entity를 추출하는 데는 상당한 시간과 리소스가 소요된다. 텍스트 마이닝 방법은 이 프로세스를 용이하게 하는 데 도움이 될 수 있다. 이러한 방법의 성능을 검증하려면 수동으로 annotation을 추가한 특허 자료가 필수적이다. 우리는 annotation guideline을 개발하고 세계 지적 재산권 기구, 미국 특허청, 유럽 특허청에서 200개의 전체 특허를 선택했다. 특허는 사전에 자.. 이전 1 2 3 4 5 6 다음