brunch

You can make anything
by writing

C.S.Lewis

by 김도환 Jun 28. 2023

대규모 언어모델(LLM)과 자연어처리 활용 개발사례

안녕하세요

기업 인공지능 도입 전문가이자,

인공지능을 쉽게 알려주는 

AI일타강사 김도환입니다.


오늘은 대규모 언어모델에 대한 설명과

 자연어 처리 기술을 활용한 

개발 사례를 소개해 드리겠습니다.






챗 GPT에 대한 사람들의 폭발적인 반응으로

대규모 언어모델에 대한 기업들의 활발한 활용이 

시작되었는데요.


그만큼 앞으로 대규모 언어모델 기술이

다양한 분야에 적용될 것임을 짐작할 수 있습니다.



먼저 대규모 언어모델의 정의는 다음과 같습니다.





대규모 언어 모델(LLM)은 

텍스트 및 코드의 방대한 데이터 세트로 훈련된 학습 모델입니다. 


기존 통계적 방법에서 인공신경망 방법으로 발전하면서 

GPT나 BERT* 등과 같은 인공신경망 모델(트랜스포머)이 대거 등장하게 되었고,

성능면에서 탁월한 성장을 이뤄냈습니다.


LLM에 학습되는 언어 데이터 세트는 정말 다양한데요.

주로 다음의 데이터셋을 학습하게 됩니다.


기사

코드

소셜 미디어 게시물

오디오 및 비디오





LLM에 학습되는 언어 데이터 세트는 

모델의 크기와 복잡성에 따라 달라집니다.


예를 들어, 100억 개의 매개변수를 가진 LLM은 

10억 개의 매개변수를 가진 LLM보다 

더 큰 언어 데이터 세트로 훈련될 필요가 있습니다.


LLM에 학습되는 언어 데이터 세트의 품질도 중요합니다. 

데이터 세트에는 오류나 편향이 없어야 합니다. 


데이터 세트에 오류나 편향이 있으면 

LLM이 잘못된 정보를 배우게 될 수 있습니다.


LLM에 학습되는 언어 데이터 세트는 항상 발전하고 있으며,

새로운 데이터 세트가 개발되고 있습니다. 



즉, LLM의 성능은 

학습하는 언어 데이터 세트의 질과 크기에 따라 크게 달라진다는 점!


* 초거대 AI는 파라미터의 숫자가 수천억 개로 매우 많으며, 

방대한 양의 데이터를 학습할 수  있는 모델로 대규모언어모델을 포함하는 개념으로 정의 가능



그럼 이번엔 LLM에서 사용되는 주요 알고리즘을

알아보겠습니다. 




여러 알고리즘들이 있지만 

위 세가지가 주로 활용하게 됩니다.




다음으로는 글로벌 기업들의 언어모델 종류를

살펴보고자 합니다.




아무래도 한국은 네이버의 하이퍼클로버를 활용한

다양한 생성 AI 서비스들이 나올 것으로 예상되는데요.




챗 GPT 보다 그 기술의 근간인

대규모 언어모델(LLM)이 중요한 이유는 다음과 같습니다.



바로 앱과 소프트웨어, SAAS형 IT 서비스 뿐 아니라

자동차, 로봇, 드론, 가전제품 등 기기 및 단말에도

적용이 가능하다는 점입니다.


앞으론 자동차안에서 AI와 일상대화가 가능해질 것으로

예상됩니다.






그렇다면 현재 대규모 언어모델이 주로 어떻게 활용될까요?

바로 자연어 처리 기술에 활용됩니다.


자연어 처리(NLP)는 컴퓨터가 인간의 언어를 

이해하고 처리할 수 있도록 하는 

컴퓨터 과학의 한 분야입니다. 


NLP는 텍스트를 생성하고, 언어를 번역하고, 

질문에 답변하고, 텍스트를 요약하고, 

텍스트에서 정보를 추출하는 등 다양한 작업에 사용됩니다.






LLM은 NLP 작업을 수행하는 데 사용할 수 있는 강력한 도구입니다.

NLP 작업의 정확성과 효율성을 향상시켰으며, NLP 작업의 새로운 가능성을 열었습니다.

LLM은 NLP 분야에서 계속해서 중요한 역할을 할 것으로 예상됩니다.






마지막으로, 자연어처리 기술을 활용한 

사업계획서 분석 솔루션 개발사례를 소개해 드리리며 마무리하겠습니다.



하단 링크를 클릭하시면 자세히 확인하실 수 있습니다.




https://brunch.co.kr/@brunchk1wj/64









감사합니다.


https://walla.my/survey/DObblYeXUxoaY7VajNu1


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari