안녕하세요. 더클라쎄 특허법률사무소 정혜윤 변리사입니다.
최근 인공지능 기술이 산업 전반에 확산되면서, AI 기술을 보호하기 위한 특허 확보 경쟁 또한 치열해지고 있습니다. AI 데이터 전처리부터, 신경망 모델 구조, 모델 학습 방법, 그리고 AI 활용 서비스까지 다양한 AI 특허들의 출원이 증가하고 있습니다. 이번 칼럼에서는 이 중에서도 AI 기술의 핵심이라 할 수 있는 '신경망 모델 구조'에 대한 특허를 어떻게 확보할 수 있는지 구글의 MoE 특허 사례를 통해 알아보겠습니다.
AI 모델 구조에 대한 특허를 준비할 때 많은 분들이 논문을 쓰는 것처럼 접근하곤 합니다. 아무래도 AI 개발하시는 분들이 특허보다는 논문을 더 많이 보시고, 더 많이 써보셨기 때문인 듯합니다. 논문에서는 연구의 재현성을 위해 모델을 구성하는 컨볼루션 레이어(convolution layer)나 어텐션(attention) 등이 어떻게 정교하게 연결되어 있는지, 각 레이어 간 구성은 어떤 식으로 이루어져 있는지 등을 아주 상세하게 기술합니다.
하지만 특허 명세서는 논문이 아닙니다. 특허의 목적은 기술의 재현이 아니라 '독점적인 권리 범위'를 확보하는 데 있습니다. 만약 논문처럼 모든 구성요소를 너무 상세하게 한정하여 특허를 받으면, 경쟁사가 아주 작은 부분만 변경해도 특허권을 회피할 수 있게 됩니다. 이는 권리 행사를 어렵게 만드는 치명적인 실수가 될 수 있습니다.
따라서 모델 구조 특허의 핵심은 각 구성요소(레이어, 모듈 등)가 전체 시스템 안에서 어떤 '역할'을 수행하는지 기능 중심으로 넓게 정의하는 데 있습니다.
이해를 돕기 위해, 구글이 개발하여 최근 거대 언어 모델(LLM)의 기반 기술로 널리 쓰이고 있는 MoE(Mixture of Experts, 전문가 혼합) 기술의 특허를 살펴보겠습니다.
MoE는 하나의 거대한 모델이 모든 데이터를 처리하는 대신, 여러 개의 작은 전문 모델(Expert)을 두고 입력 데이터의 특성에 따라 특정 전문가 모델을 선택적으로 활성화하는 기술입니다. 이를 통해 모델의 전체 파라미터 수를 크게 늘리면서도, 추론 시에는 일부 파라미터만 사용해 연산 효율을 극대화할 수 있습니다. 구글은
구글은 MoE 구조에 대해 2024년 8월 20일에 미국 특허(US 12,067,476)를 등록받았습니다. 이 특허의 핵심인 청구항 1항을 살펴보면 '역할' 중심의 설명이 무엇인지 명확히 알 수 있습니다.
[구글 MoE 특허 청구항 1항 요약]
메인 신경망은 MoE 서브네트워크를 포함하며, 이 서브네트워크는 다음을 포함한다:
복수의 전문가 신경망(a plurality of expert neural networks) 게이팅 서브시스템(a gating subsystem) 은 다음의 역할을 수행하도록 구성됨.
입력된 텍스트 시퀀스의 각 위치에 대해, 해당 위치의 텍스트 처리를 위해 활성화될 하나 이상의 전문가 신경망 조합을 선택함.
이때, 선택은 해당 위치에 있는 텍스트의 구문(syntax) 또는 의미(semantics) 중 적어도 하나에 기초하여 이루어짐.
여기서 주목할 점은 게이팅 서브시스템의 내부가 구체적인 레이어(예: 2개의 FC 레이어와 ReLU 활성화 함수)로 한정되어 있지 않다는 것입니다. 대신 '입력의 구문·의미를 파악해 전문가를 선택하는 역할'이라는 기능적 관계로 정의했습니다. 이렇게 함으로써 구글은 게이팅의 세부 구현 방식이 달라지더라도 '입력에 따라 전문가를 선택한다'는 MoE의 핵심 아이디어를 포괄적으로 보호받을 수 있게 된 것입니다.
이처럼, AI 모델의 구조를 권리화하고자 할 때에는 그 모델의 상세 레이어/함수들을 서술하는 것보다는 그 모델의 서브 네트워크들이 어떤 역할을 수행하는지 포괄적으로 기재하는 것이 가장 중요합니다.
그렇다면 국내 스타트업에서 구글의 MoE 구조를 활용하여, 이를 기업의 니즈에 맞게 일부 변형한 후 특허 등록을 받는 것은 가능할까요??
네, 가능합니다.
이미 공개된 기술이라도, 그것을 기반으로 새롭고 진보적인 무언가를 만들어냈다면 충분히 특허로 등록받을 수 있습니다. 핵심은 '무엇을, 어떻게 변형했으며 그로 인한 기술적 효과가 무엇인가'를 명확히 설명하는 것입니다.
예를 들어, 국내 스타트업이 구글의 MoE 구조를 활용하여 특허를 받는다면 다음과 같은 전략을 고려해 볼 수 있습니다.
1. 모델 일부 구성의 치환 또는 부가: 기존 MoE 구조의 게이팅 네트워크나 전문가 네트워크의 일부를 새로운 아이디어가 담긴 모듈로 교체하고, 그 모듈이 어떤 독창적인 역할을 수행하여 모델의 성능(정확도, 속도 등)을 어떻게 향상시키는지 설명하는 방식입니다.
2. 특정 도메인에 특화된 처리 방식 결합: 특정 산업 도메인(예: 법률, 의료, 금융)의 데이터를 효과적으로 처리하기 위해, MoE 모델 앞단에 해당 도메인에 특화된 독자적인 전처리 모듈을 결합하는 것도 좋은 전략입니다. 이때 전처리 모듈의 역할과 이로 인해 특정 도메인에서 MoE 모델이 어떻게 더 잘 작동하게 되는지를 구체적으로 설명해야 합니다.
결론적으로, AI 모델 구조 특허를 확보하기 위해서는 개별 레이어의 상세한 연결 관계가 아닌, 각 구성요소가 수행하는 '역할'과 그들 간의 '유기적인 관계'를 기능적으로 정의하는 것이 중요합니다. 이를 통해 넓고 강력한 권리를 확보하고, 구글, Open AI 등 AI 분야의 선두 기술 기업들이 구축한 기술 생태계 위에서 국내 스타트업이 개발한 독자적인 기술을 꽃피울 수 있습니다.
이번 칼럼에서는 AI 모델 구조는 어떻게 특허 등록을 받을 수 있을지 알아보았습니다. AI 특허에 대해 궁금하신 점이 있으신 경우, 언제든지 편하게 더클라쎄 특허법률사무소로 연락 주시기 바랍니다.
더클라쎄에서는 인공지능 개발자인 변리사가 AI 사건들을 대리하고 있습니다.COGNEX, 바이두, 뷰노, 마키나락스, 카카오게임즈, 넷마블, SIA 등의 AI 사건들을 수행하고, AI 기업들을 전담으로 맡아 기술특례상장평가를 총괄 심사하던 변리사를 통해 성공적인 AI 특허를 확보하세요.
저자 소개 | 정혜윤 변리사
정혜윤 변리사는 한국거래소와 나이스디앤비에서 인공지능과 소프트웨어 분야의 기술특례상장평가 전문위원으로 활동하였습니다. 또한, 국내 유수의 투자회사에서 벤처캐피털리스트로 활동하며 수준 높은 해외 딥테크 기술들을 다룬 경험을 가지고 있습니다.
IT와 BM 분야의 전문성을 살려 기술 기반 기업들의 기술특례상장평가 및 지식재산권 컨설팅을 수행하고 있습니다.
자세한 사항은 더클라쎄 특허법률사무소로 문의 부탁드립니다.
theclasseip@theclasseip.com
02-6925-6792