Large Language Model이란
LLM(Large Language Model, 거대언어모델)이란
ChatGPT의 등장 이후, 기업의 LLM 도입률이 비약적으로 상승했다고 합니다. 세쿼이아 캐피털이 조사한 기업 중 LLM을 적용한 앱을 만든 기업의 비중이 불과 두 달 만에 15%에서 65%로 급등했다고 합니다.
그렇다면 LLM이란 무엇일까요
LM(언어 모델)이란 인간의 언어를 이해하고 또한 그 언어의 방식으로 답을 생성하도록 훈련된 일종의 인공지능 모델입니다. 자연어 질문에 사람처럼 대답하기 위해 현재 대량의 기사, 위키피디아 항목, 책, 인터넷 기반 자료, 기타 입력물 등을 학습합니다. 텍스트 자료들은 미분류 상태로 학습되어 모델은 self-supervised learning 또는 semi-supervised learning을 주로 사용합니다. 즉, LLM은 멀티 레이어를 사용하여 복잡한 데이터를 처리, 분석 및 예측하는 딥러닝 학습 모델을 사용합니다.
LLM은 방대한 양의 학습 데이터를 이용해 일반적인 주제에 대해 많은 대화 결과물을 얻을 수 있습니다. 따라서 거대기업들이 주로 LLM 학습을 할 수 있는 제한이 있었습니다. 그러나 새로운 추세는 전문성 있는 방대하지 않은/적절한 양의 데이터를 학습하여 보다 전문적인 결과를 출력해주는 방향으로 갈 것이며 엄청난 데이터를 수집하고 그것을 학습해야 하는 하드웨어를 확보하지 않아도 될 것입니다.
LLM은 ChatGPT, BERT와 같은 모델이 있습니다. 자연어로 질문이나 요청을 해도 자연스럽게 텍스트 형태로 답을 해주는 것을 알 수 있습니다.
LLM이 왜 중요할까?
- 거대 언어모델의 산업 적용 가능성
: 서비스 제공업체, 예를 들면 컨택 센터의 경우 챗봇, 보이스봇 등 고객 서비스의 퀄리티를 높일 수 있습니
: 소프트웨어 코드를 작성할 수 있고, 로봇에 물리적인 작업을 가르칠 수도 있습니다.
: 법적인 해석이나 서류 작성 등에서도 LLM의 도움을 받을 수 있습니다.
- LLM 및 기초 모델이 비즈니스 환경에 미치는 영향
: 작업 자동화: 사람이 하는 일들을 자동화하고 창의적인 일에 인력을 쓸 수 있습니다.
: 창의적인 콘텐츠 생성: 역으로 LLM을 이용하여 창의적인 일들을 생성해 낼 수 있습니다.
: 기존 산업 전반의 데이터에 기반에 트렌드를 예측하는데 사용할 수 있습니다.
LLM의 한계
- 편향에 대한 민감성
: 트위터를 스크롤하면 알 수 있듯이 이 입력 데이터에는 상당한 양의 편향이 포함될 수 있습니다. 입력데이터의 편향은 차별적인 출력이나 기존의 사회적 불평등을 더욱 노출시킬 수 있습니다.
- 해석 능력이 부족
: 딥러닝은 종종 블랙박스라고 불립니다. 따라서 어떻게 학습되었는지 설명하기가 어렵습니다. 모델이 특정 출력에 어떻게 그리고 왜 도달했는지 정확히 알기 어렵습니다.
참고.
NLP(Natural Language Processing)
NLP의 역할은 인간의 언어를 이해하고 처리하는 데 초점을 맞춘 인공지능 분야입니다. 컴퓨터가 자연어를 이해하고 분석하여 다음 프로세스를 처리할 수 있도록 하는 기능입니다. LLM은 NLP의 부분집합으로 볼 수 있습니다.
참고문헌
https://www.thedatahunt.com/trend-insight/what-is-llm
https://www.itworld.co.kr/news/293035