질문하면 답변하는 생성형 인공지능
생성형 AI(Generative AI)는 인공지능이 데이터에서 학습한 패턴을 바탕으로 새로운 콘텐츠를 만들어내는 기술입니다. 기존 인공지능 방식과 달리 데이터를 단순히 분석하거나 분류하는 것이 아니라 새로운 텍스트, 이미지, 비디오, 소리 등을 생성하는 기술을 갖추고 있습니다.
생성형 AI는 크게 세 가지로 나눌 수 있습니다.
텍스트 생성 : 대규모 언어 모델(LLM)을 사용하여 자연스러운 문장을 생성, ex) OpenAI의 ChatGPT
이미지 생성 : Midjourney, Stable Diffusion과 같은 도구들이 텍스트 입력에 기반하여 이미지를 생성
비디오 생성 : Runway Gen과 같은 기술을 통해 텍스트를 기반으로 동영상을 자동으로 생성
LLM(Large Language Model)은 텍스트 데이터를 학습하여 자연어 처리가 가능한 딥러닝 기술로,
인간처럼 자연스럽고 일관된 텍스트를 생성하는 모델입니다. 이 모델은 GPT(Generative Pre-trained Transformer)와 같은 모델을 기반으로 하며, 인터넷상의 방대한 데이터를 학습하여 대화, 문서 작성, 번역 등의 작업에서 활용됩니다.
LLM을 적용한 서비스는 대표적으로 ChatGPT가 있습니다. OpenAI가 2022년 말에 출시한 ChatGPT는 사용자와의 대화를 통해 정보를 제공하고 질문에 답하는 대화형 AI입니다. 실용성과 편리함 덕분에 많은 관심을 받고 있습니다.
LLM의 발전은 ChatGPT 이전에도 꾸준히 이어져 왔습니다. BERT, GPT와 같은 초기 텍스트 생성 모델들이 있었으나, 인공지능의 대중화는 2022년 ChatGPT의 등장 이후 본격화되었습니다.
2022년 11월 ChatGPT 발표
2023년 2월 유료 서비스 ChatGPT Plus가 출시
2023년 3월 GPT-4가 발표, 성능과 활용 범위에서 큰 도약
2023년 후반 멀티모달 기능이 추가 GPT-V(Vison) 발표, 이미지와 음성을 동시에 처리할 수 있는 GPT-4 Turbo 및 Multimodal API (사용자가 자신만의 맞춤형 ChatGPT를 만들 수 있는 환경 마련)
구글은 Bard와 PaLM 2를 발표, 메타는 LLama와 LLama 2를 오픈소스로 공개, OpenAI 전 직원이 설립한 Anthropic은 Claude 2를 발표했습니다. 또한, 일론 머스크가 설립한 xAI는 Grok-1을 공개했습니다.
https://www.youtube.com/watch?app=desktop&si=duX-VBdytjN14H8j&v=NzxlIGPbICY&feature=youtu.be