신기술의 그 기업
기회인가 위협인가!
산업이 어디까지 발전하고 있는 건지 종잡을 수 없을 때가 종종 있죠.
오늘은 신기술의 그 기업, 최근 이슈가 되고 있는 생성형 인공지능인 챗GPT에 대해서 이야기해볼까 해요.
챗GPT가 무엇이고 어떤 영역까지 대신할 수 있는지,
그리고 앞으로의 미래에 대해서 이야기해볼게요!
2022년 11월 오픈한 챗 GPT가 공개 5일 만에 하루 이용자 100만 명을 돌파했다고 해요. 2023년 1월 월간 활성 사용자 수(MAU)도 1억 명을 돌파한 것으로 추정하고 있다는데요. SNS의 대명사로 자리 잡은 인스타그램이 100만 명을 달성하는 데까지 7개 월 가량 걸렸다는 것을 감안했을 때 성장성이 더욱 돋보여요. 한 번 사용한 사람은 감탄하고 계속 사용하게 되고, 아직 안 써본 사람은 그냥 똑똑한 심심이 아니냐고 말하는 챗 GPT의 등장이 어떤 의미를 갖는지 이야기해볼게요.
각종 논문뿐 아니라 미국 의회 연설문까지 작성했다고 해 이슈가 된 적이 있어요. 제이크 오친클로스 매사추세츠주 하원의원은 미국과 이스라엘에 공동 인공지능 연구센터를 설치하는 내용의 법안을 소개했어요. 당시 내용을 살펴보자면요.
“미국이 AI 연구에 리더 역할을 이어가고 갈수록 진화하는 기술을 책임감 있게 탐구하기 위해서는 이스라엘 등과의 국제 파트너와 협력해야 한다”라고 말했어요. 그런데 이 연설문이 사실 챗GPT가 작성한 것으로 밝혀져 세간의 주목을 받았는데요. 당시 제이크 의원은 단어 100개를 사용해 하원에 전달할 내용을 써달라고 명령했고 해당 답변을 몇 차례 다듬어 실제 연설에 활용했다고 해요. 이 연설을 들었던 모두가 인공지능이 작성했다고는 생각하지 못했다고.
천재 사상가라고도 불리는 사피엔스 저자인 유발 하라리 또한 챗GPT에 감탄한 사실이 전해졌어요. 10주년을 맞이해 사피엔스 양장 특별판 제작에 들어가게 되었고 당시 서문을 작성해야 했는데 이때, GPT-3을 활용했다고 해요. 서문은 2016년 미대선 과정에 드러난 가짜 뉴스와 SNS의 영향력 그리고 극단적 정치 이분화 등이 사피엔스가 이야기하고자 하는 ‘인간의 능력’에 대해 재검토하게 되었다는 내용이었는데요. 한국어로 230 단어, 890자로 쓰인 이 내용은 모두 챗 GPT가 작성했다고. 유발 하라리는 물론 많은 사람이 인공지능의 발전에 기겁(?)하게 됐어요.
OpenAI는 2015년 샘 알트만이 설립한 회사로 다양한 생성 서비스를 다뤄요. 오늘의 주제인 ChatGPT도 있고, 이미지 생성 서비스인 DALLE-2가 있어요. 코딩할 때 도움을 주는 Codex도 있죠.
사람들은 챗GPT의 등장으로 인해 긴장할 회사가 구글이라고 입을 모아 말하는데요. 그동안 우리는 정보를 수집할 때 구글 검색엔진을 활용했죠. 하지만 이제는 그럴 필요 없이 챗GPT에게 그냥 물어보기만 하면 되거든요. 입 소문에 입 소문을 타 공개하자마자 순식간에 200만 명의 가입자를 모았고 현재 Daily Active User(DAU) 수는 1000만 명을 넘었다고 해요.
기업가치 290억 달러, 작년 대비 두 배나 상승했지
지난해 OpenAI의 기업가치는 140억 달러였다고 해요. 그런데 올해는 290억 달러로 평가됐다고. 아직 수익이 많지 않음에도 불구하고 작년 대비 두 배 이상 높은 기업가치 평가를 받으며 미국 내에서 가장 가치 있는 스타트업으로 떠오르고 있어요. 로이터 통신에 따르면 OpenAI의 올해 목표 매출은 2억 달러, 내년에는 10억 달러의 매출까지 성장할 계획이라고 밝혔어요. 앞으로 투자자들에게 투자 유치를 받으면서 기술 도약을 지속적으로 보여주지 않을까 싶어요.
음성 언어 인공지능은 우리 삶에도 아주 가까이에 있어요. 바로 시리와 빅스비 같은 빅데이터 기반 기술인데요. 매번 소프트웨어 업데이트를 통해 연구와 개발을 지속하고 있지만 여전히 단순한 업무 실행에만 활용할 수 있다는 한계점이 명확하게 존재해요.
그렇기에 GPT의 등장이 더욱 특별하게 느껴져요. 자연어처리 인공지능 챗봇서비스인 챗GPT는 OpenAI가 공개한 초거대 언어모델 GPT-3.5 기반의 대화형 인공지능 챗봇이에요. Generative Pre-trained Transformer의 약자로 머신러닝에서 방대한 데이터를 미리 학습해 문장으로 생성하는 AI죠. 사용자가 채팅하듯 질문하면 정말 사람이 대답하는 것 같은 문장을 만들어 대답을 해줘요.
말 그대로 자가학습해 답변을 생성하고 대량의 데이터와 맥락을 처리할 수 있는 변환기예요. 문장 속의 단어와 같은 순차적인 데이터 내의 관계를 추적해 글의 맥락과 의미를 학습해요. 상황을 예로 들어 볼게요.
주요 인사들에게 새로운 제품을 소개하는 파티에 초대하는 초대장을 작성할 거야. 300자 이내로 작성해 줄래?라는 요청에 챗GPT가 답변을 작성해 줬는데, 무언가 마음에 안 들어요. 그래서 지금보다 ‘조금만 더’ 풍부하게 써줄래?라고 하면 앞전 답변보다 훨씬 좋은 답안이 완성돼요. ‘조금만 더’라는 애매한 명령을 알아듣는 거죠.
이렇듯 인간의 선호도를 AI의 보상 신호로 사용해 챗 GPT 모델을 미세 조정하며 사용자의 의도와 니즈에 부합하는 답변을 도출할 수 있도록 인간의 피드백을 반영 및 학습하는 인간 피드백 기반 강화 학습 테크닉이 적용돼 있어 그 가치가 뛰어나다고 평가받고 있어요.
그렇다면 GPT-3는 어떤 업무를 지원해 줄 수 있을까요? 인간의 지적 능력 관련 대부분 수행할 수 있다고 알려져 있는데요. 문서 생성, 질문 응답, 번역, 텍스트 요약 등을 포괄해 다양한 역할을 수행할 수 있어요. 단순한 영역이 아닌 고도의 작업까지 해낼 수 있다는 사실이 놀랍죠? 그중에 크게 두 가지를 소개해 드릴게요.
코드 작성 및 수정
직접 작성한 코드를 올리면 오류를 잡고 내용을 정돈해 줘요. 버그를 찾는 것을 넘어서 개발자들에게 코드를 짜는 방법까지 알려줄 수 있어요. 개발자들은 이제 구글링 하지 않아도 된다는 사실에 환호하기도 했어요.
웹사이트 생성
피그마를 통해 코드를 학습시킨 후 자연어로 명령하면 웹사이트도 생성할 수 있어요. 웹 개발이 개발자의 영역에서 벗어나 일반인들도 쉽게 개발할 수 있게 된 거죠.
챗GPT는 기본적으로 인터넷에 올라온 방대한 양의 데이터를 학습해 사람이 쓴 것과 같은 글을 만들어내는데요. 그렇기 때문에 현재의 정보를 알려줄 순 없지만 이전의 데이터를 활용해 논문이나 리포트 같은 과제를 ‘표절’해 대신 작성해 주는 것에 대한 우려는 지속되고 있어요.
실제로 BBC NEWS에서 보도한 바에 따르면 의사 면허 시험 합격 성적을 받기도 했고, 경영학 석사(MBA)를 통과하기도 했거든요. 이와 비슷한 사례로 미국 노던미시간대 철학과에서는 학생이 쓴 에세이가 챗GPT를 활용해 작성한 것으로 발각되기도 했어요.
이러한 현 상황은 단순히 양심의 문제를 넘어서 지적재산권 침해 혹은 표절에 대한 문제도 포함하고 있기 때문에 계속 논란이 되고 있는 건데요. 챗GPT는 이미 올라와 있는 ‘인터넷의 데이터’를 활용하기 때문에 지식과 정보를 인용 및 차용하는 과정에서 이에 대한 문제가 없을 거라고 장담하기는 어려울 테니까요.
이시한 작가의 저서인 GPT 제너레이션에서는 ‘미국 노스웨스턴대 연구진이 논문 사전 게재 사이트인 바이오아카이브에 검사한 결과 통과됐으며, 총 10편 중 3편가량은 전문가들도 가려내지 못할 정도였다’고 말해요.
표절과 지식재산권 침해라는 윤리 의식이 어디까지일지 다시 한번 고민하게 만드는 것 같아요.
그렇다면 챗GPT가 제공하는 정보를 100% 신뢰할 수 있을까요? 전문가들은 아직까지 멀었다고 생각한대요. 2021년까지의 데이터를 기반으로 학습하고 있기 때문에 최신 정보를 가지고 있지 않대요. 무엇보다 방대한 데이터 학습으로 인해 원본과 다른 사실 혹은 편향적인 정보를 제공할 수도 있고요.
챗GPT를 만든 OpenAI의 대표인 샘 알트만도 ‘챗GPT의 역량이 아직 제한적이고 프리뷰 수준’이라고 말했어요. 아직까지는 창의적인 영감을 받는 데에는 사용할 수 있지만 사실 확인용으로는 적합하지 않다고.
지식재산권 침해 및 표절과 관련해 향후 교육 전망에 대해 우려하는 목소리가 많았는데요. 고려대가 챗GPT와 같은 생성형 인공지능의 활용을 위한 가이드라인을 제시했다고 해요. 무려 국내 최초라고! 고려대 측에서는 생성형 인공지능 활용이 학습 효과를 높이며 긍정적 교육 경험이 될 수 있다고 생각한다며 이에 대한 권리 또한 보장되어야 한다는 의견이에요. 대신, 챗GPT가 대신할 수 없는 수준의 어려운 과제를 내야 한다고 교수들에게 권고했다고 해요.
해당 가이드라인에서는 표절 등을 방지하고자 학문적 진실성 위반 행위 방지 교육 및 윤리적 사용에 대한 교육을 필수로 진행해야 한다고 고지되어 있대요. 표절 방지 프로그램을 활용할 수 있지만 사실 단어만 교묘하게 바꾸면 피할 수 있거든요. 그렇기에 윤리 교육이 중요하다고 강조하는 거고요.
고대를 시작으로 앞으로 많은 학교에서 생성형 인공지능에 대한 도입과 가이드라인이 제시되지 않을까 싶어요.
콜로라도 주립 박람회의 1위를 차지한 작품이 AI 프로그램 미드저니를 통해 만들어졌다는 사실이 밝혀지면서 한 바탕 세계를 뜨겁게 달궜었는데요. 예술과 창작은 인간의 영역이라고 생각해 왔기 때문에 그 충격은 더욱 크게 다가온 것 같아요. 챗GPT의 센세이션 한 등장으로 텍스트 혹은 정보 수집 및 통계를 직무로 하는 직업이 없어지지 않을까라는 우려도 있어요.
대표적으로 작가, 개발자, 은행원, 애널리스트가 있죠. 최근 금융업에서는 AI를 적극적으로 활용한 서비스를 제공하고 있는데요. 농협은행은 AI 은행원으로 정이든, 이로운 씨를 실무부서로 배치했어요. 신규직원 직무교율을 마치고 농협은행 DT전략부 디지털 R&D센터 소속으로 배치됐다고 해요.
실제로 챗GPT에게 ‘AI가 은행원을 대체할 수 있을까?’라고 묻자 ‘은행원은 신뢰 관계가 중요하기에 이를 유지하고 관리하는 역할은 인간이 더욱 잘할 수 있을 것’, ‘하지만 기술의 발전으로 은행원의 업무는 변화가 될 수 있다’라고 말했어요.
개발 직군에서도 마찬가지예요. 개발자 5명이 필요하던 일이 챗GPT가 본격적으로 상용화된다면 코드를 직접 설계하지 않아도 기획하고 관리할 줄 아는 2명 정도만 필요하게 되겠죠. 이렇듯 챗GPT와 결속되어 있는 다양한 직업이 사라지진 않아도 업무와 규모의 변화는 충분히 있을 수 있는 일이라고 예상하고 있어요.
작가, 개발자, 은행원, 애널리스트 등뿐만 아니라 긴장하고 있는 업계가 있는데요. 바로 교육계예요. 앞서 고려대의 생성형 인공지능 가이드라인처럼 받아들이고 활용할지 규정을 강화해 제한할지에 대한 논의도 끊임없이 이어지고 있는데요. 교수나 연구자들은 논문 작성뿐 아니라 데이터 리서치 등에 큰 도움을 받을 수 있을 것이라고 말하며 앞으로 교육 환경이 점점 더 성장할 수밖에 없을 거라고 말해요.
또, 코로나 19로 비대면 교육 환경에 대한 경험이 있기 때문에 미래에는 온라인 교육과 블렌디드 러닝이 더욱 확산 가속화 될 것으로 보고 있어요. 앞으로 개인별 수준에 맞춘 더욱 체계화된 교육 시스템도 개발될지도 모르죠.
이렇게 유능하다면 지금부터 온 세상을 바꿀 파급력이 있어야 되는 거 아닌가?라고 생각할 수 있지만 아직까지는 무리라고 보고 있대요. 물론 챗GPT와 같은 생성형 인공지능 덕분에 미래 산업이 빠르게 발전하겠지만요. 여하튼 아직까지 인간을 대체할 수 없다는 점을 살펴보자면요.
기술적 한계, 외국어 학습 데이터 부족
챗GPT는 과거 인간과의 대화 과정에서 인종차별과 혐오에 대한 자각 가능성이 없어 기술적 한계로 지적된 바가 있는데요. 이러한 한계와 더불어 한국어 학습 데이터가 부족해 잘못된 사실이나 정확하지 않은 정보를 제공하고 있는 점은 아직까지 종종 살펴볼 수 있는 문제점이에요.
불법, 페이크 뉴스의 확산 우려
정교하게 만들어진 진짜 같은 가짜, 페이크 뉴스나 불법 등의 확산 우려도 고민해 봐야 해요. 미국의 유라시아그룹은 2023년 세계 10대 리스크 중 AI 챗봇을 지적했고 사회적 신뢰와 민주주의를 악화할지도 모른다고 우려하는 의견을 밝혔어요. 우리는 AI가 아니더라도 페이스북 등에서 쉽지 않게 살펴볼 수 있는 페이크 뉴스의 무서움을 알고 있으니까요.
오늘은 챗GPT에 대해 알아봤어요.
교육은 변화하고, 산업은 발전하지만 인간이
설자리를 점점 잃어가고 있는 건 아닐까
한 편으로 걱정되기도 해요.
반면, 이로 인해 더욱 윤택하게 바뀔
우리의 삶이 기대되기도 해요.
우리는 어디로 가고 있고, 어디쯤 도착해 있을까요?
그 여정을 두 눈으로 지켜보자고요!
다음에도 재미있고 유용한 리서치로 돌아오겠습니다!