본문 바로가기

논문/Patent

AI 적용 특허 신규성, 진보성 혹은 소송 결과 예측

출처: https://arxiv.org/pdf/2403.04105

7.4 Novelty and Inventiveness Prediction

7.4.1 Definition of Patent Feature, Novelty, and Inventiveness Novelty

  • 발명이 새로운 것으로 간주되려면, 발명의 모든 주요 특징을 포함하거나 설명하는 이전 문서나 다른 형태의 공개물(이들을 통틀어 선행기술이라고 함)이 없어야 합니다.
  • 신기성과 진보성은 특징의 개념에 크게 의존합니다. 특징은 발명이 발명으로서 갖춰야 하는 요소들이며, 청구항에 명시되어 있습니다. 독립 청구항은 주요 특징을 나열합니다.

7.4.2 Task Definition of Novelty and Inventiveness Prediction

  • 신기성과 진보성 예측은 이진 분류 작업으로, 기존 특허 데이터베이스를 기준으로 새로운 특허가 신기한지를 결정하는 것을 목표로 합니다.
     

7.4.3 Methodologies for Novelty and Inventiveness Prediction

Indicator-Based Methods

  • 기존 기술과 비교하여 특허의 신기성을 측정하기 위해 사전에 정의된 지표를 사용합니다. 연구자들은 새로운 특징이나 인용 횟수와 같은 다양한 측면에서 지표를 정의하고, 각 지표에 중요도에 따라 점수나 가중치를 부여하여 신기성 점수를 계산합니다.
  • 지표의 선택과 가중치는 주관적일 수 있으며, 지표가 고도로 혁신적이거나 학제간 발명의 미묘한 측면을 완전히 포착하지 못할 수 있습니다.

Outlier Detection

  • 이상치 탐지는 새로운 발명이 기존 특허의 범위 내에서 이상치로 간주될 수 있다는 가정에 기반합니다.
  • 특허 정보를 수치값으로 추출 및 변환 후 이상치 탐지 알고리즘을 통해 특허를 식별합니다.
  • Word2Vec, Latent semantic analysis(LSA), Doc2Vec 등이 활용될 수 있습니다.
  • 텍스트 임베딩 간의 차이가 발명의 특징 차이를 나타내지 않을 수 있습니다. (두 청구항이 완전히 다른 용어와 어휘를 사용하지만 거의 동일한 의미를 전달하는 경우)

Similarity Measurements

  • 특허를 초록과 같은 내용 기반으로 수치 벡터로 변환하고, 코사인 유사도와 유클리드 거리와 같은 다양한 지표를 사용하여 유사도를 계산합니다.
  • 유사도 점수가 낮은 특허는 일반적으로 더 새로운 것으로 간주됩니다. 
  • 사실, 특허 제목과 초록은 일반적일 수 있으며 특징을 공개하지 않기 때문에 이 방법은 법적 의미에서 특허 신기성을 평가하는 데 실패합니다.

Supervised Learning

  • 감독 학습은 특허 내용에서 추출한 특허 표현 벡터를 기반으로 주어진 특허가 새로운지 분류하기 위해 모델을 훈련시키는 것을 의미합니다. 
  • 일련의 방법들을 조합하여 모델을 개발하고 테스트 하였다. text representations (e.g., Word2Vec, GloVe), different classifiers (e.g., support vector machine, naive Bayes), network architectures (e.g., long short-term memory gated recurrent unit).
  • 입력은 목표 특허 청구항과 관련된 선행 기술에서 인용된 단락 텍스트입니다. 
  • 관련 문헌에서 BERT 기반의 설명 가능한 모델을 제안했습니다. 모델은 신기성 예측 결과와 함께 높은 관련성을 가진 청구항 세트를 설명으로 제공할 수 있었으며, 실험 설정에서 79%의 정확도를 달성했습니다. 
Hyejin Jang, Sunhye Kim, and Byungun Yoon. An explainable ai (xai) model for text-based patent novelty analysis. Expert Systems with Applications, page 120839, 2023.

7.4.4 Patentability Assessment

  • 주요 기준은 일반적으로 신기성, 진보성/비자명성, 유용성을 포함합니다.
  • 앞서 논의된 신기성은 발명이 기존 기술에서 알려지지 않았거나 사용되지 않았음을 의미합니다. 
  • 비자명성은 특허가 이미 알려진 것 이상의 충분한 발명 단계를 포함해야 하며, 해당 분야의 전문가에게 명백하지 않아야 함을 나타냅니다. 
  • 유용성은 발명이 유용하며 실제 적용이 가능해야 함을 의미합니다.
  • 현재 대부분의 연구는 신규성 예측에만 집중되어 있으며 비자명성까지 포함한 연구도 있다.

7.5 Granting Prediction 

7.5.1 Task Definition of Granting Prediction

  • 특허 승인 예측은 특허 신청이 심사관에 의해 승인될지 또는 최종 거절될지를 예측하는 것을 의미합니다.

7.5.2 Methodologies for Granting Prediction

  • 특허 승인 예측에 대한 연구는 몇 가지 어려움 때문에 거의 이루어지지 않았습니다. 
  • Suzgun 등은 특허 초록과 청구항을 기반으로 다양한 모델을 훈련하여 특허 승인 예측의 기준을 제시했습니다. 여기에는 합성곱 신경망(CNN)과 BERT 등이 포함되며, 정확도는 64%를 넘지 못했습니다.
Mirac Suzgun, Luke Melas-Kyriazi, Suproteem K Sarkar, Scott Kominers, and Stuart Shieber. The harvard USPTO patent dataset: A large-scale, well-structured, and multi-purpose corpus of patent applications. In Thirty-seventh Conference on Neural Information Processing Systems Datasets and Benchmarks Track, 2023.
  • Jiang 등은 특허 승인 예측을 위해 텍스트 데이터와 메타데이터를 결합한 PARCEL 프레임워크를 제안했습니다. PARCEL은 특허 초록과 청구항에서 문맥적 양방향 장단기 메모리(LSTM) 방법을 사용하여 텍스트 표현을 학습하고, 액티브 이종 네트워크 임베딩(ActiveHNE)을 기반으로 문맥 정보를 포착합니다. 저자들은 최종 예측을 위해 텍스트와 네트워크 속성을 결합할 때 주의 메커니즘을 통합했습니다. 결과는 이 방법이 약 75%의 정확도를 달성할 수 있음을 보여주었으며, 이는 PatentBERT와 같은 이전 모델을 초과한 것입니다.
Hongxun Jiang, Shaokun Fan, Nan Zhang, and Bin Zhu. Deep learning for predicting patent application outcome: The fusion of text and network embeddings. Journal ofInformetrics, 17(2):101402, 2023.
  • 위의 두 연구에서 사용된 데이터셋이 다르기 때문에 결과를 직접 비교할 수는 없지만, 두 연구는 관련 주제에 대한 향후 연구를 위해 데이터셋을 공개했습니다. 

7.6 Litigation Prediction

7.6.1 Task Definition of Litigation Prediction

  • 소송 예측은 특허가 소송을 초래할 가능성이 있는지를 예측하는 것을 목표로 합니다
  • 특허 소송에는 다양한 유형이 있습니다. 예를 들어, 특허 소송에서 가장 흔한 시나리오 중 하나는 침해입니다. 특허 보유자가 자신의 특허권이 침해되었다고 주장하는 경우입니다. 또한, 제3자가 선행 기술을 지적하여 특허 청구가 신기하지 않음을 증명하는 등 특허의 유효성을 문제 삼을 수 있습니다.

7.6.2 Methodologies for Litigation Prediction

  • Campbell 등은 메타데이터(예: 청구항 수, 특허 유형), 청구항 텍스트 및 특허 인용을 요약한 그래프 특징을 결합하여 예측에 활용했습니다.
W Campbell, L Li, C Dagli, K Greenfield, E Wolf, and J Campbell. Predicting and analyzing factors in patent litigation. In NIPS2016, ML and the Law Workshop, 2016.
  • Liu 등은 회사의 소송 기록을 결합하여 회사 간 소송을 공동으로 예측했습니다. 저자들은 특허 콘텐츠 특징 벡터와 소송 기록에 대한 텐서를 통합한 딥 러닝 모델을 훈련시켰습니다. 이 방법은 텍스트 입력만 사용하는 것보다 정밀도가 10% 이상 향상되었습니다.
Qi Liu, Han Wu, Yuyang Ye, Hongke Zhao, Chuanren Liu, and Dongfang Du. Patent litigation prediction: A convolutional tensor factorization approach. In IJCAI, pages 5052–5059, 2018.
  • Wu 등은 원고, 피고, 특허 간의 복잡한 관계를 더 효과적으로 포착하기 위해 특허와 회사의 수치 표현을 개선했습니다. 저자들은 이 방법이 이전 접근법에 비해 성능을 최대 10%까지 향상시키고, 다양한 데이터 부족 상황에서도 강건성을 보인다는 것을 입증했습니다.
Han Wu, Guanqi Zhu, Qi Liu, Hengshu Zhu, Hao Wang, Hongke Zhao, Chuanren Liu, Enhong Chen, and Hui Xiong. A multi-aspect neural tensor factorization framework for patent litigation prediction. IEEE Transactions on Big Data, 2023.