brunch

You can make anything
by writing

C.S.Lewis

by 최재철 Apr 22. 2024

LLM(대규모 언어 모델)이 할 수 있는 것

LLM(대규모 언어모델)이 가능한 것은 여러가지가 있습니다. 그 중에서 일부분만 언급하면 다음과 같습니다.  

질문에 대한 대답

문장의 요약

감정 분석

기계 번역

작사 나 글쓰기 같은 창작영역

문장의 분류

키워드 추출

프로그램 code 의 버그 체크 및 해결책 제시


최근에는, 텍스트 이외의 데이터 데이터 곧, 화상이나 음성, 영상 등을 학습시킨 LLM도 등장하고 있습니다.

또는 텍스트와 이미지를 동시에 학습한 멀티모달형태의 LLM도 등장하고 있습니다. 


LLM은 기본적으로 지시를 보내는 입력(프롬프트)에 의해, 다양한 출력이 가능합니다. 

대표적인 제품인 ChatGPT 에서 프롬프트의 작성을 어떻게 하느냐에 따라 결과의 퀄리티가 달라집니다. 

그래서 최근에는 이와 같은 LLM을 잘 다루는데 있어서 빼놓을 수 없는 프롬프트의 기초 지식이나, 출력 정밀도의 높이는 여러가지 방법들을 학습하고, 이를 전문적으로 다루는 프롬프트 엔지니어링 기법들이 속속히 나오고 있습니다. 또한, 기업 현장에서도 LLM 활용에 있어서 프롬프트 엔지니어링이 필수입니다. 


LLM(대규모 언어 모델)을 활용한 대표적인 서비스

CHATGPT VS. MICROSOFT COPILOT VS. GEMINI


여기서, LLM 중에서도 인지도가 높은 「ChatGPT」와 MS의 「Copilot」, 그리고 Google에 의한 「Gemini」라고 하는 3개의 서비스에 대해, 특징을 대략적으로 소개합니다.

(* 참고 : 마이크로소프트가 빙(Bing)에 GPT-4를 추가하고 코파일럿(Copilot)으로 이름을 바꾸었음)


ChatGPT

ChatGPT

'챗GPT'는 인공지능 연구개발 기관인 오픈AI가 출시한 자연어 처리(NLP) 모델을 이용한 AI 채팅 서비스입니다.2022년 11월 공개 후 혁신적인 서비스로 순식간에 주목을 받았고, 전세계적으로 큰 화제를 모았습니다.

2023년 3월에는 기존 모델(GPT-3, GPT3.5)에 비해 높은 능력을 갖춘 'GPT-4'가 출시되어 유료플랜(Chat GPT Plus)에서 이용이 가능합니다.GPT-4에서는 처리능력이 대폭 강화되고 있어 화상이나 그림과 텍스트의 조합에 대해 텍스트를 출력하는 작업이나, 보다 복잡한 지시에 대한 처리가 가능해졌습니다. 

2023년 5월에는, iPhone(iOS)버젼 ChatGPT 앱이 발매되어 스마트폰으로부터 무료로 이용할 수 있는 환경이 갖추어졌습니다. (*제가 주로 이용하는 서비스가 되어버렸습니다. ^^)


Copilot 

Copilot(구 Bing AI채팅)이란, Microsoft(마이크로 소프트)가 제공하는 검색 엔진 「Bing」에, GPT-4 탑재한 제품입니다. 

Copilot은 검색엔진과 연동되어 있기 때문에 실시간 정보를 반영하면서 답변을 진행합니다.출력 내용에는 참조 페이지 URL이 포함되어 있어 사용자는 참조 페이지에 클릭 하나로 출력 내용의 사실 확인을 할 수 있습니다.

또, AI채팅에는 「Bing Image Creator」라고 불리는 이미지 생성 기능이 탑재되어 있어 채팅을 사용해 이미지의 생성도 할 수 있습니다. 단지, 응답 회수의 제한이나 Bing 자체가 시장 점유율의 낮다는 것이 과제로 남아 있습니다.


Gemini

Google이 개발한 「Gemini(구 Bard)」는, LaMDA라고 불리는 대화 애플리케이션 전용의 모델을 베이스로 채용한 AI 서비스입니다. 

인간과 같은 자연스러운 대화가 가능한 AI 채팅 시스템에 구글의 검색 서비스를 연계하고 있어, MS와 마찬가지로 인터넷상의 최신 정보를 포함한 답변 제공을 기대할 수 있습니다.

2023년 5월 10일, Google I/O 2023에서 Gemini 1.0 모델이 처음 공개되었습니다.

2023년 9월경, 일부 기업을 상대로 테스트가 시작되었다가, 최근 2024년 2월 15일, Gemini 1.5가 공개되었습니다.


대규모 언어 모델(LLM)을 기업에 활용하는 방법

기업에 있어서의 LLM의 활용 방법에 대해서 설명하겠습니다. 당연한 이야기지만, 기업도 다양한 업무에 활용가능합니다. 주로 생산성의 향상이나 업무 부담의 경감, 비용절감 이라고 하는 메리트를 기대할 수 있습니다.


■ 고객지원업무

기본적으로 챗봇은 고객 지원 업무를 주로 담당합니다. 여기에 LLM을 이용한 AI 챗봇을 통해 홈페이지나 브랜드 사이트의 FAQ 페이지 등에 접목하면 사용자가 입력한 질문과 요청에 바로 답변할 수 있습니다.

콜센터에 대한 문의가 줄어들기 때문에 운영자의 부담 경감이나 비용 절감 같은 효과를 기대할 수 있습니다.남은 인적 자원을 다른 업무에 돌려, 새로운 실적 향상으로 연결하는 것도 가능합니다.

또한 24시간 언제든지 이용할 수 있으며 빠른 궁금증 해결로 이어짐으로써 고객 만족도 향상도 기대할 수 있습니다. AI 챗봇 도입으로 기업과 고객의 소통이 원할하게 됩니다. 


■ 시장조사 및 보고서작성

LLM에 의한 대표적인 서비스인 ChatGPT는 텍스트 대화 형식으로 문장 생성이나 자동 요약과 같은 작업을 지시할 수 있습니다. LLM에서는 대량의 정보를 압도적인 속도로 처리할 수 있기 때문에, 장문 리포트나 논문의 요약등도 단시간에 완료합니다.

의사결정이나 판단이 신속하게 되어 비즈니스의 가속화로 이어집니다. 또한 LLM을 통해 정보 수집의 자동화도 가능하기 때문에 시장 트렌드나 소비자의 생각을 수집하고 분석하는 방법으로도 LLM이 편리합니다. 

(* 참고 : 이는 Agent 기능을 추가로 개발해야 합니다. )

SNS나 뉴스 사이트 등 대량의 소스에서 관련 정보를 자동으로 추출할 수 있기 때문에 전략 수립이나 경쟁력 향상에 도움이 됩니다.


■ 애플리케이션 및 소프트웨어 개발

LLM은 나날이 진화하고 있으며 개발의 효율과 품질이 향상되고 있습니다.코드 생성이나 버그 검출 등 소프트웨어 개발 영역에서는 이미 LLM이 이용되고 있습니다.

요건을 지정하는 것만으로 코드를 자동으로 생성해 주기 때문에 업무 효율화에 의한 납기 단축도 전망할 수 있습니다.또한 구문 오류나 논리 오류의 자동 검출 및 수정 제안도 가능하여 버그 수정이 조기에 완료됩니다.

(* 간혹 이상하게 답변할 수 있으니, 개발자의 기본적인 역량 바탕위에 사용되어야 합니다. )

또한 개발자는 창의적인 업무에 집중할 수 있어 개발 비용 절감에도 도움이 됩니다. LLM의 진화 발전은 소프트웨어 개발에 있어서의 새로운 가능성의 확대와 보다 고품질의 소프트웨어의 개발에 공헌할 것으로 기대할 수 있습니다.


기업의 LLM(대규모 언어 모델) 활용한 실제 사례

지금부터는, 실제로 LLM(대규모 언어 모델)을 활용하고 있는 기업의 사례를 소개합니다.

온라인 중고 마켓플레이스 메르카리(Mercari)는, 생성 AI에 의한 「메르카리 AI 어시스트」의 제공을 개시했습니다. 이는 상품 추천을 돕는 쇼핑 어시스턴트 도구로 

"어버이날 엄마를 위해 어떤 선물을 사야 할까요?" 또는 "요즘 유행하는 청바지 스타일 찾아줘."라고 입력하면,  챗봇이 후속 질문을 통해 결과의 범위를 좁힌 다음 몇 가지 상품을 추천하는 서비스입니다. 


이 기능을 통해 구매자에게 있어 보다 매력적인 상품 정보가 공개되어 신속한 구매 결정으로 이어진다는 장점도 기대할 수 있습니다. 물품 추천 뿐만이 아니라,  메르카리를 사용할 때의 다양한 상황에서 AI에 의한 서포트를 받을 수 있도록 기능이 계획되고 있습니다.


독일 이커머스 업체 잘란도(Zalando)도 패션 제품 및 스타일 질문을 기반으로 고객이 상품을 찾을 수 있도록 도와주는 ChatGPT 기반 서비스를 제공하고 있습니다. 

'친한 친구의 5월 결혼식에  어떤 옷을 입어야하지? ' 입력 하면,  AI는 고객이 결혼식에 참석하기 위한 옷을 찾고 있다는 것을 이해하고 관련된 상품을 추천해줍니다.  

잘란도(Zalando)


LLM(대규모 언어 모델)의 과제

대규모 언어 모델은 획기적인 진화와 함께, 급속히 사회에 침투하고 있습니다만, 현시점에서는 과제도 남아 있습니다.현시점에서 LLM이 안고있는 주요 3가지 과제에 대해 이야기하겠습니다.


■ 출력 정밀도는 모델에 따라 달라진다

현재 LLM의 출력 정확도는 채택하고 있는 언어 모델이나 서비스에 의존하고 있으며, 어떤 것을 사용하느냐에 따라 응답 내용이나 정확도는 크게 달라집니다.

Chat GPT에서 채택되고 있는 'GPT-4'에서는 GPT-3을 넘는 파라미터 수를 가진 모델인 반면, Google의 'Bard'에서 사용되고 있는 LaMDA는 경량 모델이라고 공표되어 있습니다. 모델이 다른관계로 구글보다 ChatGPT가 인간의 대화에 가까운 자연스러운 답변을 출력할 수 있습니다.


■ 할루시네이션(환각)을 일으킬 위험성이 있다

할루시네이션(Hallucination)이란 일명 환각이라는 뜻으로 인공지능(AI)이 그럴듯한 거짓말을 하는 것을 뜻합니다. 자연어 처리(NLP) 에 있어서는, 사실과는 다른 정보나, 문맥과 전혀 관계없는 내용을 출력해 버리는 현상을 가리킵니다. 이는 어떻게든 답변을 내 보내고자 만들어져 있기 때문입니다. 

ChatGPT를 비롯한 생성 AI가 널리 쓰이게 된 현재, 실제 학습하지 않은 정보를 꾸며내 마치 사실인냥 결과를 내보내서 오해를 살 위험성이 있습니다.

시스템의 성능이 올라감으로써 할루시네이션의 빈도나 영향은 줄어들 것으로 예측되고 있습니다.

다만, 문장생성AI의 특성상 완전히 방지 할 수는 없을것으로 생각됩니다.

또한 생성하는 문장의 유연성과 다양성을 유지하고 LLM의 사용처를 한정하지 않기 위해서도 사용자 측이 할시네이션의 가능성을 항상 염두에 두고 사용해야 합니다.


■ 적대적 프롬프트에 대한 대책이 불충분

프롬프트를 사용한 언어 모델에 대한 공격 기법을 "적대적인 프롬프트"라고 불립니다. 적대적인 프롬프트에 의해 모델의 반응성능 저하나 기능 저하 등의 위험이 있을 수 있습니다. 

주요 적대적 프롬프트에는 다음 3가지가 있습니다.  

프롬프트 인젝션(Injection)

프롬프트 해킹

Jailbreak(탈옥)

"프롬프트 인젝션"은 교묘한 질문이나 지시를 입력하여 모델의 출력을 탈취하는 것입니다.제3자의 개인정보를 공개하는 근거 없는 루머를 확산시키는 등의 위험성이 있어 보안의 취약성으로도 우려되고 있습니다.

'프롬프트 해킹'는 프롬프트가 보유한 정보를 끌어내는 기술입니다.본래 공개되어서는 안 되는 정보가 포함된 프롬프트를 사용하여 정보를 누설시킵니다.

'Jailbreak'는 교묘한 프롬프트를 사용하여 모델의 제한을 푸는 기법입니다. 대표적으로 '모델에게 다른 인격을 설정하여 대답하게 한다' 등의 방법에 의해 차별이나 폭력과 같은 비윤리적 내용이나 위법행위를 조장하는 정보 등, 조정되고 있는 내용을 회답시키는 데 성공해 버립니다.

이러한 적대적 프롬프트에는 날마다 대책이 강구되고 있습니다만, 아직도 결함이 남아 있는 상황입니다. LLM을 사용함으로써 문제로 발전하는 일이 없도록 사용자 측에서 위와 같은 리스크를 잘 인식하고 적절한 사용법을 해야 합니다.


(* 적대적 프롬프트에 대해서는 따로 다루도록 하겠습니다.)


결 론

계속해서 대규모 언어모델(LLM)의 발전이 이루어지고 있습니다. 학습데이터양의 증가, 처리속도의 개선 등. 앞으로도 이와같은 모델 개선이 기대됩니다.

LLM은 기본적으로 많은 양의 데이터를 학습하고 작업을 처리합니다. 그런데, 품질을 더 높이기 위해서는 데이터 양뿐만 아니라 질을 고수해야 합니다. 편견과 오류를 배제함으로써 보다 정확하고 공평한 예측과 추론으로 이어집니다.

또, 모델 사이즈가 커지면, 데이터의 영역이나 양을 넓혀도, 많은 지식이나 정보를 부드럽게 학습하는 것이 가능합니다. 효율적인 학습이나 추론을 실현할 수 있고, 계산 비용이나 메모리 소비의 부담을 경감하면서, 복잡한 정보를 부드럽게 처리할 수 있는 성능을 나타낼 수 있습니다. 그러나 반대로 쓸데없는 정보들이 더 들어가서 불필요한 정보를 리턴받게 됩니다. 사용자에 따라, 필요에 따라 LLM 선택할 수 있어야 합니다. (TV 시청에 나이제한을 두듯이 말이죠~)

또한, LLM을 포함한 생성 AI의 과제 중 하나가 도덕이나 가치관의 문제입니다. LLM을 사용하는 가운데 편견이나 차별, 허위 등 부적절한 말이나 사생활, 보안 침해 등의 위험이 남아 있습니다. 이는 앞으로 게속해서 고쳐가야 할 문제입니다. 



== 참고사이트 ==

 https://www.marketcast.co.kr/entry/리테일-기업은-챗GPTChatGPT를-어떻게-활용하고-있을까

작가의 이전글 Meta, 최신 언어 모델 라마3 출시

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari