brunch

You can make anything
by writing

C.S.Lewis

초거대 인공지능 모델이 해줄 수 있는 것

뉴스스크랩

기사 제목


마이크로소프트, 생산성 도구에 ‘코파일럿’ 결합... “일하는 방식 근본적으로 바꿀 것"


https://www.itworld.co.kr/news/282763


기사 요약


    최근 인공지능 초거대모델 GPT-3를 공개한 이후 공격적으로 GPT-4까지 공개한 마이크로소프트가 자사의 업무 생산성 도구들에 업무용 코파일럿(Copilot)을 적용해 직원들의 업무에 더 큰 자율성을 부여하고, 인간의 언어이자 가장 보편적인 인터페이스인 자연어로 기술에 더 쉽게 접근할 수 있도록 했다.


 워드, 파워포인트, 엑셀로 구성된 마이크로소프트 365앱에 코파일럿을 내장해 요구사항을 글로 적으면 원하는 대로 구현을 해주는 방식이라고 간결하게 설명해 볼 수 있다. 추가로 비즈니스챗(Business Chat)이라는 자사의 업무 메신저에서도 활용이 되어 자연어 명령어로 일정, 이메일, 회의 일정, 채팅 히스토리 등을 업데이트할 수 있다. 예를 들어 워드(Word)에서 코파일럿은 사용자를 위해 글을 작성, 편집, 요약, 창작할 수 있다. 파워포인트(Powerpoint)에서는 간단한 자연어로 입력한 명령어를 디자인된 프레젠테이션으로 전환할 수 있다. 엑셀(Excel)에서는 데이터 시각화, 인사이트 발굴 등과 같은 정량적/정성적 분석 업무가 몇 단어의 명령 만으로 실행될 수 있다. 

이런 코파일럿의 소개와 더불어 마이크로소프트는 고객 콘텐츠 혹은 사용자의 개별 프롬프트(명령어)에 의해 거대 모델이 학습되지 않으며 사용자 그룹 간에 데이터가 유출되지 않도록 보장하는 보안성을 강조하고 있다. 



핵심 기술 및 비즈니스 소개 


    마이크로소프트의 OpenAI에서 만들어낸 GPT-3, 그리고 최근에 GPT-3의 몇 가지 부분들을 개선해서 다시 만들어낸 GPT-4는 기본적으로 Transformer라는 인공신경망 구조를 사용한 것으로 추정되고 있다. 이는 GPT-3와는 다르게 훈련 과정, 데이터, 컴퓨터 성능 등 구체적인 정보가 드러나지 않았기 때문이다. 다만 이전의 ChatGPT에 사용된 GPT-3.5와는 다르게 허용되지 않은 콘텐츠 제작 요청을 받았을 때 이 명령을 처리할 가능성이 GPT-3.5보다 82% 적고, 거짓 정보나 잘못된 내용을 생성할 확률도 60% 적다고 말했다. 기본적으로 GPT는 생성 AI이기 때문에, 방대한 양의 데이터를 학습 후 사용자가 자연어를 통해 명령을 입력하면 이를 이해하고 결과물을 출력해 주는 방식이다. 기사의 내용처럼 이번 마이크로소프트 생산성 툴에 적용된 GPT-4는 이전 GPT-3과 ChatGPT에 적용된 GPT-3.5와는 다르게 자연어 텍스트 이외에 이미지를 입력했을 때도 답변을 생성해 주는 멀티모달(Multi-Modal)이라는 점이다. 아래와 같이 사진을 이해해야만 답변할 수 있게끔 질문을 해도 사진을 이해하고 그에 맞는 답을 생성해 내는 구조를 볼 수 있다. 

데이터의 크기를 늘리고 인공신경망에서 고려하는 파라미터(변수)의 숫자를 늘려서 모델의 성능을 개선하는 방법은 어떤 모델의 발전 방법이든 이견이 없는 정석일 것이다. 그러나 컴퓨팅 파워, 연산 속도 및 학습 데이터를 분류하는 과정에서 물질적, 시간적 한계가 있기 때문에 가장 데이터의 형태가 간단한, 텍스트를 이용해 언어 모델을 만들어왔던 것이다. 오디오나 이미지보다 데이터의 형태와 크기가 간단하기 때문이다. 그러나 GPT-4는 이미지를 입력해도 이를 이해하는, 텍스트와 이미지가 결합된 입력을 이해하는 멀티모달의 형태를 보여주었고 이는 GPT-4와 같은 거대언어모델이 이미지 처리, 오디오 처리와 같은 데이터들도 처리해 비정형 데이터들을 망라할 수 있는 아키텍처를 구현할 수 있음을 보여주었다. 



기사의 시사점 및 인사이트


    마이크로소프트가 그들의 작업 도구인 워드, 파워포인트, 엑셀 등에 GPT-4를 적용시키는, 코파일럿을 내장했다는 것은 거대 인공지능이 이 분야와 관련이 없는 일반인들에게도 상당히 가까이 있다는 것을 의미하고 있다. 마이크로소프트의 작업 도구들을 컴퓨터를 쓰는 사람이라면 쓰지 않을 수 없지 않은가. 데이터의 양의 증가와 학습 과정의 개선 등 특이점이라고 생각했던 ChatGPT에 사용된 GPT-3.5보다 더 개선된 성능을 보여준 GPT-4를 보며 여전히 모델의 성능을 높이는 정석적인 방법이 통하고 있다는 점도 생각해 볼 수 있었다. 또한 마이크로소프트가 강조한, 사용자 개인의 특성이나 프롬프트가 학습에 반영되지 않는다는, 어찌 보면 강력한 학습 방법을 포기하고 보안에 신경을 쓴다는 태도는 사용자가 모델, 그리고 이 모델을 감싸고 있는 ChatGPT와 같은 서비스를 신뢰하게끔 만들어주는 것 같다. 



생각해 볼 만한 논점


Q1. 인공지능 모델을 개발하는 개발자나 연구원이 아닌 입장에서, GPT-4와 같은 거대 모델들이 어떤 형태의 서비스로 일반 사용자들에게 다가올 수 있는지 고민해 볼 필요가 있는 것 같다. 기존 직업들의 업무 영역에서 활용 방법이나 새로운 직업 유형을 탄생시킬 수도 있지 않을까?



작성자: ITS 24기 구본승 



작가의 이전글 보이스피싱도 음성분석 AI가 잡는다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari