대규모 언어 모델에 대한 이야기
2023년 단연 화두는 chat GPT, 바드의 등장이었다. 대규모 언어 모델의 등장과 함께 일상 속 많은 부분이 바뀌었다. 글쓰기, 자료 조사, 분석, 기획은 물론이고 특정 학문에 대한 지식을 기반으로 여러 개념이나 예제 문제 제공 등의 튜더 역할, 창작 도우미, 코치, 공동 작업자 등 다양한 역할로 활용하고 있다. chat GPT를 시작으로 바드, 제미니 등 다양한 모델이 앞다투어 나오고 있다. 그중에서 대규모 언어 모델의 양대산맥으로 불리는 chat GPT와 바드는 어떤 공통점과 차이점이 있는 것일까?
대규모 언어 모델이란?
먼저 뉴스를 보다 보면 생성형 AI와 대규모 언어 모델(LLM)이 동시에 나오면서 혼용되는 경우가 많다. 우리가 자주 사용하는 chat GPT나 구글의 바드는 LLM이라는 수식어와 함께 설명하곤 한다. chat GPT나 구글 바드를 이야기할 때 꼬리표처럼 따라오는 LLM은 언어를 학습하여 처리하기 위해 만들어졌다. 대규모 텍스트 데이터 세트에서 얻은 지식을 기반으로 텍스트와 다양한 콘텐츠를 인식하고 요약, 번역, 예측, 생성할 수 있는 딥러닝 알고리즘이다. 대규모 언어모델은 방대한 양의 데이터를 이용해 학습을 한다. 인터넷에서 작성된 거의 모든 것을 망라할 만큼 엄청나게 큰 데이터 세트에 의해 훈련된다.
LLM은 데이터 입출력 집합을 통해 학습된 머신러닝 신경 네트워크로 콘텐츠가 LLM에 입력되면 알고리즘이 예측한 다음 단어가 출력된다. 생성형 ai는 이미지, 음악, 언어 등의 다양한 데이터를 학습해 맥락이나 문장 구조, 문맥을 학습하게 된다. 일정한 패턴을 학습하면서 새로운 텍스트나 이미지, 음악 등을 생성하는 것이다.
구글 바드와 제미니, Chat GPT와의 차이점은?
오픈 AI에서 2018년 GPT1에 대한 논문을 발표하면서 본격적으로 GPT의 가능성에 대해 주목하기 시작하였다. 스타트업 경영 분야의 아버지인 '샘 올트먼(sam altma)'을 중심으로 연구개발과 제품화를 시작하면서 마이크로소프트와 손을 잡게 되었다. 텍스트의 방대한 데이터 세트를 기반으로 훈련되어 자연스러운 챗봇 대화에 탁월하다. Chat GPT 무료 버전과 플러스라는 유료 버전이 있다. 무료 버전은 Chat GPT 3.5를 이용하고 유료버전은 GPT4를 활용하게 된다. 사람과 유사한 방식으로 의사소통하고 대화하면서 콘텐츠를 창작하는데 탁월하다.
구글 바드는 구글 AI에서 개발한 LLM이다. chat GPT와 마찬가지로 동일하게 방대한 텍스트 데이터 세트에서 훈련이 되었고 다양한 콘텐츠를 제시할 수 있다. GPT2, 3와 GPT같이 바드도 palm2라는 언어 모델을 활용한다. 두 모델 모두 대규모 언어 모델이라는 측면에서 공통점이 있다. 그래서 텍스트 기반으로 대화하고, 답변, 대화 기록도 채팅을 통해 확인할 수 있다. 사용방법은 비슷하지만 사용자가 체감하는 경험 측면에서 다소 다른 점들이 눈에 띈다. 대표적으로 근거 도출, 음성 옵션 변경, 응답 결과 수정 측면에서 Chat GPT와 바드는 다른 점이 눈에 띈다.
근거 도출
질문을 하였을 때 chat GPT는 질문에 대한 답변만을 충실히 전달한다면, 바드는 어떤 근거로 답변이 도출되는 것인지 검색 결과에 대한 링크가 함께 나타난다. 피그마에 대한 유용한 팁을 알려달라고 했을 때, chat GPT의 경우 질문에 맞춰 피그마 툴에 대한 다양한 팁을 안내하였다. 총 12가지의 기능을 상세히 전달하였고, 각 기능에 대한 설명 역시 충실한 편이다. 같은 질문을 바드에 하였을 때 바드는 효율성과 협력 측면으로 나눠 기능을 안내하였다. 답변의 길이는 Chat GPT에 비해 짧은 편이었지만, 구조화가 되어 있었다. 또한 외부 링크를 기재하여 추가적인 정보를 얻도록 돕고 있는 점에서 chat GPT와 다른 경험을 하게 되었다.
개발 측면에서 리액트 사용 팁에 대해 질문을 하였다. 마찬가지로 chat GPT의 경우 리액트의 기능들을 위주로 답변이 상세히 도출되었다. 바드는 각 기능들에 대한 설명은 chat GPT에 비해 간단하면서 동시에 도출된 답변에 대한 근거를 표시하는 형태로 도출하였다.
음성 옵션 변경
Chat GPT는 텍스트 기반에서 한 단계 더 도약을 하였다. 플러스와 엔터프라이즈 사용자는 구두로 자연스러운 대화가 가능하다. 다양한 성우들의 음성을 사용해 변형할 수 있다. 실제 사람 목소리를 기반으로 이뤄져 매우 자연스럽게 들린다. 워낙 자연스러워 '듀오링고'와 같은 언어 학습 도구에서도 언어 훈련을 위해 사용할 정도이다.
바드 역시 음성 응답 기능이 지원되지만 다양한 음성 변형에는 한계가 있다. 짧은 답변부터 긴 답변까지 음성 지원이 된다. 다만 여성, 남성 등 다양한 음성 옵션 지원은 되지 않는다.
응답 결과 수정
답변 결과가 마음에 들지 않을 때 chat GPT에서 할 수 있는 방법은 질문을 다시 만들어 제시하는 것이다. 원하는 답변이 나올 때까지 계속 질문을 수정하면서 응답 결과를 정교화해나가야 한다. 반면 바드의 경우 답변을 미세 조정할 수 있다. 더 길게, 더 요약해서 답변을 조정할 수 있다. 답변을 미세 조정할 수 있어서 원하는 답변이 안 나올 때 다시 질문을 하는 대신 답변을 조정하면서 원하는 답변을 이끌어 낼 수 있다. 다시 질문을 하며 처음부터 답변을 이끌어내는 대신 답변을 조정하며 수정해 나갈 수 있다.
대규모 언어 모델은 더 많은 양의 텍스트를 학습할수록 더 정교하게 발전하게 될 것이다. 이미 충분히 자연스러운 대화를 이어나갈 수 있지만 보다 빠른 속도로 기하급수적인 발전이 예상된다. 선도적으로 활용하면 가치를 창출하고 더 많은 시간을 확보하면서 인간이 더 가치 있는 일에 시간을 쏟을 수 있게 된다. 어떻게 하면 ai를 잘 활용하게 될지는 앞으로 더 고민해야 할 우리 모두의 과제이다. 공감능력과 같은 인간의 고유성을 강화하면서 ai를 활용하는 것이 더욱 필요하다.