본문 바로가기

논문/Patent

특허 마이닝을 이용한 국방관련 국제특허분류 개선 방안 연구

J Korean Soc Qual Manag 2022; 50(1): 21-33.

Published online: March 28, 2022

DOI: https://doi.org/10.7469/JKSQM.2022.50.1.21

서론

 첨단화하는 국방 기술의 트렌드에 대응하기 위해 민간 부문의 4차 산업혁명 기술을 국방 분야와 연계하기 위한 필요성이 증대되고 있다(National Science and Technology Council, 2018).

 국방관련 특허는 특성 상 일반인에게 공개될 경우 국가 안보에 위협이 될 수 있으므로 이를 방지하기 위해 정부는 국방관련 특허출원의 비밀취급 제도를 운영하고 있다. 「특허청훈령(제822호, 2015. 7. 25., 일부개정)」에서는 ‘국방관련 특허출원의 분류기준(이하 분류기준)’을 국제특허분류(International Patent Classification : 이하 IPC)와 선진특허분류(Cooperative Patent Classification : CPC)에 기반하여 규정하고 있다. 정부의 국방관련 특허출원의 비밀취급 제도에도 불구하고, 출원인이 고의로 국방 관련 출원으로 제출하지 않거나 분류기준에 해당하지 않아 국가 안보와 관련된 특허가 공개될 가능성이 존재함에 따라 분류기준을 시의 적절하게 개정할 필요성이 있다.

 본 연구는 정부가 관리하고 있는 분류기준에 해당하는 국방 기술이 다른 기술과 어떻게 융합되고 있는지를 데이터 마이닝 기법을 활용하여 체계적으로 분석함으로써 분류기준 개정의 필요성을 확인하고 분류기준 개정 시 후보군 도 출 방법을 제안하고자 하였다. 이를 위해 2009년부터 2020년까지 출원 및 등록된 분류기준에 해당하는 특허를 대상 으로 그간 융합연구에 주로 활용되어 온 사회연결망 분석(Social Network Analysis : 이하 SNA)과 연관규칙 분석 (Association Rule Analysis) 기법을 이용하여 국방 기술의 융합 구조, 융합 패턴, 중심기술 등 전반적인 융합 현상을 분석하였다.

이론적 배경

- 국방관련 특허출원의 분류기준

 국방관련 IPC는 서브클래스를 기준으로 12개 IPC로 구성되어 있으며, 잠수함, 미사일, 장갑차 등 기계 관련 분류와 폭약, 기폭장치 등 화공 관련 분류 등이 이에 해당한다. 국방관련 IPC를 main group을 기준으로 살펴보면 Table 1과 같다. 

Table 1. Defense Related IPC

- 선행연구

  • Choi(2013): 장갑기술 분야 미국 특허의 초록 및 청구항을 기초로 텍스트마이닝, 군집분석 등을 활용하여 선진국의 기술 동향을 시계열적으로 파악함으로써 새로운 기술의 탐색 방법을 모색
  • Son(2018): 화력 분야의 방위산업체에서 보유한 특허를 대상으로 연관규칙 분석을 활용하여 국방 기술의 특성과 공백기술을 파악하기 위한 방법을 제안
  • Park et al.(2019): 국방기술품질원 보유 DB를 활용하여 국방 분야 중소․벤처기업의 기술 동향을 SNA 관점에서 분석함으로써 국방 강소벤처 기업의 R&D 동향을 확인
  • Jeon et al.(2020): 해외 국방 뉴스 정보를 기초로 텍스트마이닝과 토픽모델링을 활용하여 장갑전투차량에 관한 기술 동향을 분석함으로써 국방 기술 동향 분석의 체계 수립에 기여
  • Son et al.(2020): 국방관련 IPC를 활용하여 확보한 국방 특허를 대상으로 데이터마이닝 기법을 활용하여 향후 군 역량 확보를 위해 필요한 분야를 탐색하기 위한 방법을 제안
  • Kim and Cho(2021): 국방과학연구소 보유 특허를 대상으로 SNA와 연관규칙 분석을 활용하여 국방 기술 동향을 융합 관점 에서 종합적으로 분석

- 사회연결망 분석

 SNA는 개체들 간의 관계 속에서 나타나는 연계적인 속성(relational property)을 해석하는 방법론적인 틀이다 (Scott, 1988; Hanneman and Riddle, 2005). SNA에서 노드는 논문, 특허, 과제 등의 데이터를 기초로 연구자, 출원인, 출원국가, 기술분류 등의 형태로 정의될 수 있다. 반면 링크는 노드 간 관계를 나타내며 공동 집필, 인용 관계, 동시 분류(co-classification) 등의 형태로 동시 발생(co-occurrence)을 기초로 정의될 수 있다(White and McCain, 1997).

- 연관규칙 분석

 연관규칙 분석은 대량의 데이터로부터 자주 발생하는 패턴을 발견하여 의미 있는 연관성을 도출하기 위해 사용되 는 방법으로 Agrawal et al.(1993)가 제시하였다(Zhao and Bhowmick, 2003). 연관규칙 분석은 두 가지 아이템의 발생 빈도와 동시발생 확률을 이용하여 아이템 간 연관성을 분석한다(Suh, 2017). 연관규칙 분석에서 연관성을 판단 하는 지표로는 지지도(support), 신뢰도(confidence), 향상도(lift) 지표가 있다. 지지도는 아이템을 X와 Y라고 했을 때 X와 Y가 동시에 발생할 확률을 의미하며, 신뢰도는 X가 발생했을 때 Y가 발생할 조건부 확률을 의미한다. 향상도 는 X와 Y의 신뢰도를 Y로 나누어 산출한다(Jang et al., 2016).

[Association rule (연관규칙)] Support, Confidence, Lift, Interest-Support, Cross-Support (tistory.com)

연구 방법

- 연구의 프레임워크

국방 기술이 급속한 기술발전 속에서 첨단기술 또는 타 분야 기술과 어떻게 융합되고 있는지를 분석함으로써 분류기준 개정의 방향성을 도출하는 것을 목적으로 하였다. 이를 위해 특허분석 서비스인 윈텔립스(WIPS, 2021) DB를 활용하여 국방관련 IPC에 해당하는 특허를 수집하고, IPC가 동시 발생한 특허, 즉 융합기술 특허를 선별하여 분석 대상 DB를 구축하였다. 융합 현상을 분석하기 위해 SNA와 연관규칙 분석을 활용하여 연결망 관점에서 국방 기술의 융합 구조, 융합 패턴, 중심기술을 분석하였다. 본 연구의 전체적인 프레임워크는 Figure 1과 같다.

Figure 1. Research Framework

- 융합기술의 정의 및 유형

 일반적으로 특허의 IPC를 활용한 융합 연구에서는 연구 목적에 따라 융합기술을 서로 다르게 정의하고 있다. IPC 를 활용한 선행연구를 살펴보면 IPC 4자리, 즉 서브클래스를 기준으로 융합기술로 정의하는 연구가 대부분이나, 본 연구는 국방관련 IPC로 범위가 한정됨에 따라 IPC 7자리를 기준으로 2개 이상의 IPC를 가진 특허를 융합기술로 정의하였다. 연결망 구축을 위해 하나의 특허에 부여된 IPC를 노드, 하나의 특허에 부여된 IPC가 동시 발생하는 것을 링크로 정의하였다.

 선행연구에서는 노드 간 거리가 짧을수록 기술 간 근접성이 높아져 융합 연구의 흐름 및 확산이 밀접하게 발생하는 것으로 해석(Yang and Heo, 2017)된 바 있으며, 노드 간 거리가 긴 경우 많은 단계를 거치기 때문에 시간과 비용이 많이 소요된다고 해석(Park and Kim, 2017; Kim and Cho, 2021)된 바 있다. 본 연구에서는 노드 간 ‘거리’에 초점을 두고 노드 간 거리가 짧을수록 융합의 강도가 높은 것으로 정의하였다.

 IPC 4자리가 같은 경우, 동종기술 융합, IPC 3자리가 같은 경우, 동종분야 융합, IPC가 동일하지 않은 경우 이종기술 융합으로 정의하였으며, 융합의 유형은 Table 2와 같다.

Table 2. Type of Convergence

- 분석 데이터

 2009년부터 2020년까지 총 12년 동안 출원 및 등록된 특허 중 Main IPC가 국방관련 IPC에 해당하는 모든 특허를 수집하였다. 특허의 출원인이 국방 관련 정부기관 및 연구소인 경우 공공 부문으로 정의하였으며, 출원인이 기업, 대학, 정부기관 및 연구소인 경우 민간 부문으로 정의하였다. 출원인 유형이 ‘개인’으로 분류되는 특허는 분석 대상에서 제외하였다. 또한 시계열 분석을 위해 전체 분석 기간을 일반적인 국가 R&D 수행 주기인 3년 단위로 구분하였다. 본 연구의 분석 데이터는 총 1,952건이며, 공공 부문과 민간 부문 데이터는 각각 543건, 1,409건이다.

- 분석 모형

 본 연구에서는 2개의 사분면 모형을 활용하여 분석하였다. 첫 번째 모형은 연결망 관점에서 융합 구조를 분석하기 위한 ‘중심화(centralization)-평균 경로거리(average distance) 사분면’ 모형이다. 두 번째 모형은 노드 관점에서 융합이 활발하게 일어나는 중심기술을 분석하기 위한 ‘근접 중심성(closeness degree)-매개 중심성(betweenness degree) 사분면’ 모형이다.

 

[네트워크 분석] 네트워크 중심성(Centrality) 지수 - 연결(Degree), 매개(Betweeness), 위세(Eigenvector), 근접(Closeness) : 네이버 블로그 (naver.com)

Figure 2. Analysis Model

- 유사도 분석 기준

근접 중심성-매개 중심성 사분면 모형의 1사분면에 위치한 기술, 즉 중심기술은 급속한 기술발전에 따라 기술 간 융합이 활발하게 일어나는 기술로 해석할 수 있다. 따라서 중심기술 중 비(非)국방 기술로 분류된 기술이 국방 관련 IPC와 유사도가 높게 나타난다면 추후 모니터링이 필요한 IPC로 간주할 수 있다. 국방관련 IPC와 유사도는 IPC 자리수를 기준으로 4단계로 구분하였으며, 유사도 기준은 Table 3과 같다.

Table 3. Index of Similarity Analysis

분석 결과

- 융합 구조 분석

 국방 기술 연결망의 융합 구조를 정태적·동태적으로 분석하기 위해 공공 부문과 민간 부문으로 구분하여 SNA의 중심화, 밀도(density), 평균 경로거리 지표 값을 분석 구간별로 산출하였다. 정태적 분석 결과는 Table 4와 같다.

Table 4. Result of Static Structure Analysis

 동태적 분석 결과는 Table 5와 같다. 동태적 분석 결과를 바탕으로 중심화-평균 경로거리 사분면을 활용하여 융합 구조의 동태적 변화를 분석한 결과는 Figure 3와 같다. (P#는 09년부터 20년까지 3년 단위)

Table 5. Result of Dynamic Structure Analysis

 공공 부문은 2사분면에서 3사분면을 지나 1사분면으로 이동한 것을 볼 수 있다. 이는 기술의 특수성이 확보되는 구조에서 점차 중앙 집중적 융합 구조로 변화함을 의미한다. 민간 부문은 공공 부문과 같은 2사분면에서 1사분면을 지나 4사분면으로 이동한 것을 볼 수 있다. 이는 기술의 특수성이 확보되는 구조에서 점차 중앙 집중적 융합 구조로 변화하였으며, 더불어 융합이 용이한 구조로 변화했음을 의미한다.

Figure 3. Result of Deg. Centralization-Avg. Distance Quadrant

- 융합 패턴 분석

 국방 기술 연결망의 융합 패턴을 분석하기 위해 공공 부문과 민간 부문으로 구분하여 연관규칙을 생성하고 지지 도, 신뢰도, 향상도 지표 값을 산출하였다. 지지도 및 신뢰도 상위 20개 규칙을 대상으로 생성된 연관규칙을 통해 융합 패턴의 유형을 확인하였으며, 분석 결과는 Table 6와 같다.

Table 6. Result of Type Analysis

 연관규칙을 X→Y로 표현할 때, 지지도는 같지만 신뢰도가 다른 패턴의 경우, 신뢰도가 높은 패턴의 X를 선행기술로 해석할 수 있으며, Table 7에 굵은 글씨로 표기하였다.

Table 7. Results of Association Analysis

- 중심기술 분석

공공 부문과 민간 부문으로 구분하여 SNA의 근접 중심성과 매개 중심성 지표 값을 산출하였다. 근접 중심성과 매개 중심성 지표를 기초로 사분면을 구성하여 1사분면에 위치한 노드, 즉 융합이 활발하게 일어나는 중심기술을 도출하였다. 중심기술은 국방관련 IPC를 기준으로 국방 기술과 비국방 기 술로 구분하였으며, 분석 결과는 Table 8과 같다.

Table 8. Result of Closeness-Betweenness Deg. Quadrant

중심기술을 국방 기술과 비국방 기술로 구분하여 살펴보면, 공공 부문의 경우 전체 중심기술 중 8.7%(46개 중 4개) 만이 비국방 기술로 나타났으나, 민간 부문의 경우 전체 기술 중 32.4%(68개 중 22개)가 비국방 기술로 나타났는데, 이는 민간 부문에서 개발된 국방 기술이 타 분야 기술과 활발하게 융합되고 있음을 의미한다. 

- 국방관련 IPC 개정 후보군

 국방관련 IPC 개정 후보군을 도출하기 위해 비국방 분야 중심기술과 기존 국방관련 IPC 간 유사도를 분석하였으 며, 분석 결과는 Table 9와 같다. 중심기술은 급속한 기술발전에 따라 기술 간 융합이 활발하게 일어나는 기술을 의미하는데, 비국방 분야에 해당하는 중심기술이 기존 국방관련 IPC와 유사도가 높게 나타난다면 분류기준 개정 시 새롭게 편입시켜 지속적인 모니터링이 필요한 국방 기술로 간주할 수 있다. 분석 결과, 급속한 기술발전에 따라 기술 간 융합이 활발하게 일어나는 기술, 즉 비국방 중심기술은 25개 기술로 나타났다. 이 중 유사도가 매우 높거나 높은 기술 9개와 유사도가 매우 낮거나 낮은 기술은 16개로 분석되었다. Table 9에서 음영으로 표시된 유사도가 높게 나타난 9개 중심기술은 기존 국방관련 IPC와 3자리 이상이 동일하기 때문에 국방 기술로 간주할 수 있다.

Table 9. Result of Similarity Analysis