You can make anything
by writing

C.S.Lewis

LLM을 활용한 특허분석 프로젝트의 이상적인 형태는?

범용적인 AI 솔루션의 한계와 기업 맞춤형 분석 프로젝트의 필요성에 대해

by 특허법인BLT Mar 25. 2025
아래로




참고할만한 이전글

인공지능 부리기 2편


작년에 생성형 모델을 활용하여 특허를 분석하는데 활용할 수 있는 여러가지 생각에 대해 의견을 남긴 바 있다. 일반적인 특허분석 프로젝트에 있어서, 모수(rawdata)가 10,000개 이하인 프로젝트가 대부분이다. 기술분야에 따라 원천데이터를 10,000개나 그 이후로 설정하더라도 큰 무리가 없는 프로젝트가 있는 반면, 대기업이 시장을 주도하는 경우에는 한 기업의 특허만 보더라도 10,000개가 훌쩍 넘는 경우가 많다. 기업 입장에서 생각해본다면 좀 더 많은 특허를 보고 싶은 욕심이 나는 것은 당연한 일이다. 기존에는 더 많은 특허를 보고 싶더라도 시간과 비용의 제약으로 인해 어려움이 있었으나, 변리사와 연구원을 보조할 수 있는 생성형 AI의 너무나도 빠른 발전으로 인해 이제는 실현 가능한 이야기가 되었다.



기업이 가지는 선택의 폭은

가장 쉽게 생각해볼 수 있는 기업의 선택지는 기존 상용 AI 솔루션을 자체적으로 활용하는 일이다. ChatGPT와 같은 다양한 인공지능 서비스를 직접 활용할 수 있다. 대화형 인터페이스 창에서 특허내용을 입력하거나 개발인력 활용이 가능한 경우에는 API 서비스를 활용하여 대규모 특허분석 업무를 직접 기획하고 수행할 수 있다. 자유도가 높고 원하는 형태로 특허문헌을 입력하거나 분석할 수 있기 때문에 특허 분석 방향을 관리하고 지시할 수 있는 전문인력만 내부에 있다면 가능한 시나리오로 보인다. 비용 측면에서도 내부 인력을 활용한다면 외부 전문인력을 활용하여 컨설팅 형태로 진행하는 것에 비해 AI 서비스의 사용료나 API 과금 비용은 미미한 수준이다.


다만, 일반적인 기업의 경우에는 AI 솔루션의 특허분석 방향을 수립하고 초기 단계에서 여러 번 검증해야 하는 프롬프트 설계 능력과 특허 분석 능력을 동시에 갖춘 전문인력이 없는 경우가 대부분이다. 직접적인 구축이나 실행이 가능한 조직은 결국 소수의 대기업에 불과할 것으로 보인다. 특허내용을 분석했다고 하더라도 결국 특허분석 결과가 도출되면 환각이나 게으름 등의 이유로 수천건에서 수만건에 달하는 AI 분석내용을 최소 수준이라도 리뷰하는 업무가 필요한데 이 부분도 기업에 큰 부담이 될 수 있다. 


LLM의 등장 이후에 전례없이 특허업계에 신규 진입하여 특허나 상표 분야에 특화된 인공지능 기반의 솔루션을 제공하는 IT 솔루션 업체가 증가하고 있다. 예전 글에서도 특허업계가 적어도 IT 측면에서는 소외된 시장이었다는 점을 나눴던 바가 있는데, LLM이 상용화 수준으로 개발되면서 이를 이용하여 특허를 기반으로 기업을 분석하거나, 특허 문헌 일부를 생성하거나, 특허 검색을 확장하거나, 상표를 검색하고 상품을 추천하는 등 다양한 서비스가 등장하고 있다. 아마도 특허청에서 관리하는 특허와 상표 문헌이 태생적으로 구조화되어 있는 정보로서 가치가 있고, xml 과 같은 벌크데이터를 제공하거나 API로 구조화된 정보를 쉽게 제공받을 수 있기 때문에 여러 AI 업체들이 다양한 기회를 바라보고 있는 것 같다. 변리사들 입장에서야 당연히 환영할 일이고 더 많은 기업이 특허분야의 다양한 솔루션을 개발하고 지속 가능한 서비스 공급이 가능하다면 특허업계가 더 발전할 수 있는 기회가 될 수 있음은 자명하다.


특허분석용 AI 기반 솔루션도 등장하고 있는데, 정보나 키워드를 입력하면 그에 맞는 특허를 찾아주고 검색한 내용을 확장하거나 특허문헌 간의 유사도를 기반으로 검색되는 특허문헌의 범위를 넓히는 등의 여러가지 기능을 제공하고 있다. 다만, 기업의 특허분석 목적이나 방향이 다르기 때문에 서비스 흐름을 표준화 하는데 어려움을 겪는 것으로 보인다. 하나의 특허에 담긴 여러가지 정보를 원하는 방향으로 분석하고 유의미한 결론을 추출해내기 위해서는 기업의 요구사항이 유연하게 담길 수 있는 유연성과 확장성이 필요한데 이를 사용자경험으로 녹여내는 것은 어려운 일이다. 대체로 이러한 솔루션들은 변리사들이나 특허법인을 대상으로 서비스가 제공되는 것이 일반적인데, 변리사들은 이 서비스의 직접적인 수혜자라기 보다는 이 서비스를 활용해서 2차적인 서비스를 제공하는 서비스 공급자다. 상황이 이렇다보니 특허법인에게 있어서 고객사가 요구하는 다양한 요구조건을 수용하는 방식으로 서비스를 활용할 수 있는 유연성이 중요할 수 밖에 없다.


다만, 유연성을 강조하다보면 서비스 흐름을 정하기 어렵고, 일정한 틀 안에서 서비스를 제공한다고 하면 까다로운 고객사와 까다로운 특허업계의 요구사항을 담아내기는 어려운 문제가 있다. 버티컬 서비스로 제한된 영역에서만 서비스 가능한 솔루션을 공급하는 것도 한 방법이 될 수 있지만, 버티컬 서비스가 살아남기에는 특허업계의 IT 영역 규모가 아직 충분하지 않다는 문제를 고려하지 않을 수 없다.


상황이 이렇다보니, 특허분석 니즈가 있는 기업이 직접적인 특허분석용 AI 기반 솔루션을 사용하는 것도 쉬운 선택은 아니다. 이미 특허분석을 원하는 기업들은 변리사들이 입맛에 맞게 원하는 요구조건에 따라 완전 개인화된 특허분석 컨설팅 결과물을 공급받는데 익숙한 상황이기 때문에, 어느 정도 정형화를 전제로 구현될 수밖에 없는 특허분석용 AI 기반 솔루션을 사용하는 경우는 일반적인 특허동향 분석 등 제한된 사례에 그칠 가능성이 높다.




인공지능의 최대 강점은 범용성에 기반한 개인화

인공지능 솔루션을 활용하는데 여러가지 장점이 있지만, 개인적으로 생각할 때 인공지능 특히 생성형 인공지능의 최대 강점은 개인화라고 생각한다. 물론 일반적이고 짧은 프롬프트 입력을 통해서 나오는 결과물은 개개인별로 크게 다르지 않을 수 있지만, 이러한 일반적인 결과물은 사실 기존에도 구글링 등을 통해서도 어느 정도 얻을 수 있는 정보 수준으로 볼 수도 있다. 좀 더 세분화된 프롬프트 입력을 통해 개개인의 요구사항을 구체적으로 입력할수록 개개인의 요구사항에 맞는 맞춤형 결과물을 제공받을 수 있다는 점이 생성형 AI 모델의 가장 큰 강점이다. 일반 사용자들이 간혹 범용적으로 훈련된 ChatGPT에 실망하는 이유이기도 한데, 구체적으로 요청하지 않고 질의를 입력하게 되면 ChatGPT가 대체로 추상적인 답변을 내놓는 경향 때문인 것 같다. 결국 사용자들은 좀 더 짧게 입력하고 좀 더 구체적인 답변을 얻길 원하는데, ChatGPT는 범용적인 모델이기 때문에 일반 고객을 대상으로 무엇이든 물어보면 납득할 수준으로 대답할 수 있는 범용성에 초점을 맞추고 있기 때문에 두루뭉술한 질문에 두루뭉술하게 대답하는 경향을 보이는 것 같다. 그래서 좀 더 선명하고 날이 선 대답을 원하는 고객을 위해 더 특화된 서비스가 계속 시도되고 있고 특정 도메인이나 특정 형태에서 더 좋은 대답을 보이는 서비스가 있다면 나름의 독자적인 영역을 구축해가고 있다.


특허분석용 AI 기반 솔루션을 활용한 특허분석도 마찬가지다. 결국 기업의 요구사항이나 상황이다르고 특허를 분석하는 목적이 다르기 때문에 그 미묘한 차이를 아직 범용적인 특허분석용 AI 기반 솔루션이 제대로 분석하기는 어려울 것으로 보인다. 요구사항에 맞는 개인화 과정이 전제가 되어야 하는데, 결국 표준화된 솔루션 보다는 맞춤형 프로젝트가 더 부합될 것으로 보인다. 일반 IT 업계의 언어로 바꿔보자면 특허분석용 AI 기반 솔루션은 범용적이고 가벼운 SaaS 클라우드 솔루션 보다는 SI형태의 온프레미스 솔루션에 가까울 것으로 보인다. BLT가 수행한 다양하고 많은 특허 분석 프로젝트를 돌아보더라도 각각 다른 고객사의 요구를 표준화 하는 것은 어려운 일이고, 프로젝트 수행 방법론은 표준화가 가능할지라도 수행 대상이나 방향은 달랐다. 특허 분석 코어를 변리사의 두뇌에서 LLM으로 옮긴다고 하더라도, 분석 대상 특허의 범위부터 미세한 분석 관점을 명확히 제시하기 위해서는 맞춤형 설계가 반드시 필요할 것으로 보인다.


보안 이슈도 고려사항이 될 수 있다. 다양한 기업의 특허분석 관점과 그 결과물이 하나의 SaaS 솔루션에 누적된다면 정보 노출에 민감한 기업에게는 부담으로 작용할 수 있다. 대기업이나 공공기관들이 클라우드 도입이 여전히 보수적으로 반응하거나 프라이빗 클라우드로 타협점을 찾는 이유도 마찬가지로 볼 수 있다. 특허법인과 변리사들은 법적으로 비밀유지의무가 있을 뿐 아니라, 제한된 내부 인력만이 정보에 접근하기 때문에 상대적으로 보안 이슈에서 자유로운 편이다. 물론 LLM을 분석에 활용한다고 하면, 분석을 수행하는 담당자가 일정한 정보를 LLM에 입력해야 하는 것은 마찬가지로 볼 수 있다. 물론 대규모 특허분석을 대화형 콘솔에서 수행할 수는 없기 때문에, API 사용을 전제로 한 이야기이긴 하지만, 보안 측면에서 보더라도 대화형 콘솔보다 API가 정보의 통제나 보안 레벨에 대한 가이드라인이 높기 때문에 가능하다면 API를 활용하는 것이 바람직하지 않을까 생각한다.




LLM 활용을 위한 최적의 조건은

개인적으로 판단할 때, LLM을 활용할 경우 특허분석에 있어서 여러가지 장점이 있지만, 그 중에서도 가장 큰 효과를 낼 수 있는 분석기법은 구성요소 간의 유기적인 결합관계를 탐색하는 것이라고 생각한다. 인공지능의 추론 능력이 크게 증가했기 때문에 더 구체화된 분석방향인데, 아시다시피 특허발명은 복수의 구성요소로 이루어져있고, 특허의 핵심사상은 구성요소들의 유기적인 결합관계를 통한 효과에 있다. 변리사들은 구성요소를 정의하는데 있어서 각자 다른 깊이와 다른 언어를 사용한다. 그렇기 때문에, 구성요소 사이의 유기적인 관계를 분석하는데 전제가 되는 구성요소가 내가 찾는 구성요소인지 특정하는 전공정이 필요하다. 특허 검색식이라고 부르는 검색키워드 조합에서 많은 변형키워드를 넣는 이유도, 키워드를 달리 썼지만 같은 구성요소인 경우를 놓치지 않기 위함이다. LLM에서는 변형키워드를 굳이 넣지 않더라도 글의 맥락에 따라 구성요소의 관계를 추론하고, 구성요소의 기능이나 역할에 따라 분류하고 작업자가 찾는 구성요소와 유사성이 있는지 좀 더 깊이있게 파악할 수 있다. 구성요소와 구성요소의 유기적인 관계로 마찬가지로 각자의 언어로 관계를 규정한 내용을 추상화하거나 공통요소를 추출해서 의미적인 유사 관계를 찾는 것도 LLM의 돋보이는 점이다.


물론 위에서 언급한 구성요소의 유기적인 결합관계를 찾고 분석하는 것은 특허분야의 전문가인 변리사들이 잘 하는 업무지만, 하나 하나의 특허를 모두 들여다보고 구성요소의 결합관계나 원리 등을 추출하는 것은 수량적인 한계가 있다. 그래서 변리사들이 집중하고 들여다볼만한 핵심특허나 유효특허 범위를 현실적으로 줄이기 위해 다양한 기법을 동원해서 모수를 줄여가는 것인데, 이 과정에서 다양한 변수나 예외가 발생할 가능성을 부인하기 어렵다. LLM을 활용한다면 원천적으로 이러한 손실이나 누락 가능성을 차단할 수 있다는 장점이 있다.



전술한 조건을 교집합으로 추출해보면 LLM을 활용해서 대규모 특허분석 프로젝트를 SI성으로 수행할 수 있는 역량이 있는 곳에 맡겨야 한다는 것이 핵심인데 현실적으로 이런 수행기관을 찾는 것은 어려운 일이고, 수요도 많지 않기 때문에 실제 수행사례도 아직 많지 않다. 보안 이슈 때문에 BLT가 수행했던 대규모 특허분석 프로젝트를 직접적으로 소개하기는 어렵지만, 다음에 기회가 된다면 LLM으로 어느 수준까지 분석이 가능한지 이야기해볼 기회가 있으면 하는 바램이다.




BLT 칼럼은 BLT 파트너변리사가 작성하며 매주 1회 뉴스레터를 통해 발행됩니다.

뉴스레터 구독신청



필자 소개

유철현 대표 변리사는 서울대 재료공학부를 졸업하고 2007년 44기 변리사 시험에 합격했습니다. 스타트업을 발굴하고 직접 투자하는 ‘엑셀러레이터형’ BLT 특허법률사무소를 시작으로, IT와 BM분야의 전문성을 살려 다양한 기술 기반 기업의 지식재산 및 사업 전략 컨설팅을 수행하고 있습니다. 현재 중소벤처기업진흥공단 심의위원과 한국엔젤투자협회 TIPs 사업 심사를 담당하고 있습니다.


특허법인 BLT

누군가는 특허를 만들 때, BLT는 당신의 사업의 성공을 만들어 냅니다. The Only Firm for Your Success!!

#인공지능 #협업모델 #혁신 #딥러닝 #머신러닝 #특허업계 #생성형인공지능 #GAI #자연어처리 #빅데이터 #특허분석 #인공지능한계 #지식재산전문가 #윤리책임 #사회책임 #기술혁신 #직업윤리 #프롬프트체이닝 #특허명세서 #프레임워크 #지식재산 #업무효율화 #특허제도 #고객경험 #사용자경험 #UX #경험설계 #고객만족 #출원일 #공개문헌 #등록가능성 #특허성 #신규성 #진보성 #리스크 #리스크관리 #IP리스크 #포트폴리오 #IP #비즈니스 #특허 #business #지식재산 #BLT #비엘티 #특허법인 #특허제도 #기업가치 #상장 #코스피 #나스닥 #비공개 #스타트업 #금융 #투자 #밸류에이션



작가의 이전글 트럼프 시대의 특허 출원 실무

브런치 로그인

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari