인공지능 발명을 특허로 등록받기 위한 방법
https://brunch.co.kr/@goodpat/38
앞 포스팅에서 인공지능 기술의 핵심은 학습된 인공 지능 모델을 이용하여 문제를 해결하는데 있으나, 학습된 인공 지능 모델 자체는 특허권의 보호 대상이 될 수 없음을 말씀드렸습니다. 그렇다면 인공지능 기술에 대한 특허를 받기 위해서는 어떻게 해야 할까요? 특허청에서 발간한 인공지능 분야 심사실무가이드에서는 학습 모델에 더하여 “인공지능 관련 발명을 구현하기 위한 구체적인 수단”을 기재할 것을 요구하고 있습니다.
이하에서는 특허청의 심사실무가이드를 참조하여 인공지능 관련 발명을 구현하기 위한 구체적인 수단에는 어떤 것들이 있는지 살펴보도록 하겠습니다.
인공지능 모델을 학습을 위해서는 학습 데이터가 반드시 필요합니다. 동일한 구조를 가지는 모델이라도 어떤 학습 데이터를 사용하는지에 따라 학습된 모델의 성능이 달라지는 경우 또한 비일비재합니다.
만약 기존에 사용하지 않았던 새로운 종류의 데이터를 인공지능 모델의 학습에 이용함으로써 기존의 학습 방법에 비해 학습된 인공지능 모델의 성능을 높일 수 있다면 학습 데이터 자체를 인공지능 관련 발명을 구현하기 위한 구체적인 수단으로 기재하여 특허를 받을 수 있습니다.
학습 데이터를 생성하기 위해서는 원시 데이터(raw data)로부터 주요 속성(feature)을 도출하거나, 데이터를 규격화(벡터화, 정규화, 표준화 등)하거나, 적절한 증강(augmentation) 기법을 통해 데이터의 양을 늘리는 등의 과정이 필요합니다. 이 과정을 학습 데이터의 전처리라고 합니다.
데이터 전처리는 인공지능 모델의 학습에서 가장 중요한 과정 중 하나로서, 동일한 원시 데이터를 사용하더라도 어떠한 전처리 과정을 거쳤는지에 따라 인공지능 모델의 성능이 좌우될 수 있습니다. 따라서 개발된 기술이 기존에 없던 새로운 전처리 방법을 사용하고 있다면 이를 인공지능 관련 발명을 구현하기 위한 구체적인 수단으로 기재하여 특허를 받을 수 있습니다.
여기서 “학습 모델”이란 “학습된 인공지능 모델”과는 다른 개념으로서, 학습 데이터를 이용하여 학습을 수행하기 위한 인공 신경망 구조를 의미합니다. 예를 들어 영상 데이터 학습의 경우 합성곱 신경망(CNNs, Convolutional Neural Networks)이, 시계열 데이터(time-series data)와 같이 시간의 흐름에 따라 변화하는 데이터의 경우 순환 신경망(RNNs, Recurrent Neural Networks)이 사용되고 있습니다.
만약 데이터의 특성에 따라 둘 이상의 인공신경망을 조합하거나 인공 신경망 내의 파라미터를 최적화함으로써 기존의 학습 모델보다 더 나은 성능을 얻을 수 있다면, 학습 모델 또한 인공지능 관련 발명을 구현하기 위한 구체적인 수단이 될 수 있습니다.
손실함수(Loss Function)란 인공지능 모델의 학습 과정에서 모델이 예측한 값과 실제 정답과의 차이를 비교하기 위한 함수로서, 인공지능 모델 학습의 길잡이 역할을 하는 중요한 요소입니다. 앞서 언급한 인공지능 모델 학습의 다양한 요소들과 마찬가지로, 기존에 없던 새로운 손실함수를 적용하거나 기존의 함수를 개선함으로써 인공지능 모델 학습의 성능을 높일 수 있다면 이를 인공지능 관련 발명을 구현하기 위한 구체적인 수단으로 기재하여 특허를 등록받을 수 있습니다.
인공지능 기술을 특허로 등록받기 위해서는, 지금까지 설명한 것과 같은 인공지능 관련 발명을 구현하기 위한 구체적인 수단이 반드시 포함되어야 합니다. 물론 여기서 예시한 것 이외에도 인공지능 발명을 구현하는 데 필요한 기술적 요소들을 새로 개발하였다면 이를 기술적 특징으로 하여 특허를 등록받을 수 있습니다.
다음 포스팅에서는 인공지능 기술을 특허로 출원할 경우에 유의할 사항에 대해 정리해 보도록 하겠습니다.