brunch

You can make anything
by writing

C.S.Lewis

by 임표정 Oct 27. 2024

생성형 AI, 대규모 언어 모델 (LLM)

질문하면 답변하는 생성형 인공지능


생성형 AI(Generative AI)

  생성형 AI(Generative AI)는 인공지능이 데이터에서 학습한 패턴을 바탕으로 새로운 콘텐츠를 만들어내는 기술입니다. 기존 인공지능 방식과 달리 데이터를 단순히 분석하거나 분류하는 것이 아니라 새로운 텍스트, 이미지, 비디오, 소리 등을 생성하는 기술을 갖추고 있습니다. 


생성형 AI는 크게 세 가지로 나눌 수 있습니다.  

텍스트 생성 : 대규모 언어 모델(LLM)을 사용하여 자연스러운 문장을 생성, ex) OpenAI의 ChatGPT

이미지 생성 : Midjourney, Stable Diffusion과 같은 도구들이 텍스트 입력에 기반하여 이미지를 생성

비디오 생성 : Runway Gen과 같은 기술을 통해 텍스트를 기반으로 동영상을 자동으로 생성


대규모 언어 모델(Large Language Model)

  LLM(Large Language Model)은 텍스트 데이터를 학습하여 자연어 처리가 가능한 딥러닝 기술로,
인간처럼 자연스럽고 일관된 텍스트를 생성하는 모델입니다. 이 모델은 GPT(Generative Pre-trained Transformer)와 같은 모델을 기반으로 하며, 인터넷상의 방대한 데이터를 학습하여 대화, 문서 작성, 번역 등의 작업에서 활용됩니다.

   LLM을 적용한 서비스는 대표적으로 ChatGPT가 있습니다. OpenAI가 2022년 말에 출시한 ChatGPT는 사용자와의 대화를 통해 정보를 제공하고 질문에 답하는 대화형 AI입니다. 실용성과 편리함 덕분에 많은 관심을 받고 있습니다.


챗봇으로 보는 LLM의 발전

    LLM의 발전은 ChatGPT 이전에도 꾸준히 이어져 왔습니다.  BERT, GPT와 같은 초기 텍스트 생성 모델들이 있었으나, 인공지능의 대중화는 2022년 ChatGPT의 등장 이후 본격화되었습니다. 


주요 LLM 모델
LLM 모델 발전


2022년 11월   ChatGPT 발표 

2023년 2월     유료 서비스 ChatGPT Plus가 출시 

2023년 3월     GPT-4가 발표, 성능과 활용 범위에서 큰 도약

2023년 후반    멀티모달 기능이 추가 GPT-V(Vison) 발표, 이미지와 음성을 동시에 처리할 수 있는 GPT-4 Turbo 및 Multimodal API (사용자가 자신만의 맞춤형 ChatGPT를 만들 수 있는 환경 마련)


  구글은 Bard와 PaLM 2를 발표, 메타는 LLama와 LLama 2를 오픈소스로 공개, OpenAI 전 직원이 설립한 Anthropic은 Claude 2를 발표했습니다. 또한, 일론 머스크가 설립한 xAI는 Grok-1을 공개했습니다.



LLM 해결해야 할 문제 


잘모르면 없는 정보를 이야기한다. 할루시네이션 사실과 다른 정보를 생성

출처 : 당근 테크 유튜브

https://www.youtube.com/watch?app=desktop&si=duX-VBdytjN14H8j&v=NzxlIGPbICY&feature=youtu.be


 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari