오픈 AI가 만든 대화형 인공지능 ‘챗 GPT’를 공개한 지 두 달 만에 하루 1000만 명, 월 1억 명이 사용하고 있다. 실로 놀라운 돌풍이다. '챗 GPT' 공개 전후 세상은 분명하게 달라지고 있다. 혹자들은 '챗 GPT'의 일부 어설픈 답변, 오류 등을 내세워 평가절하하려 한다.
이는 밀려오는 큰 파도를 안 보고 튕기는 작은 물방울만 보며 변화를 두려워하는 우매한 태도다. 현재 ‘챗 GPT’가 2021년까지 데이터로만 학습한 점 등 몇 가지 소소한 문제는 스스로 완성도를 높이며 고도화한다. '챗 GPT'는 인류의 정치 경제 사회 문화 등 전반에 대변혁을 가져온다. 아니 시작되었다.
▲ LLM이 챗 GPT 엔진, 다양한 차가 나오고 또 활용하여 직접 만들 수 있어
이미지출처 gettyimages 인공지능(AI)은 기업에서 특정목적으로 사용하는 알파고와 같은 '산업용 AI'와 일반사용자를 위한 '프런트 AI'형태로 1960년대부터 개발되어 왔다. AI는 최근 몇 년 동안 딥 러닝, 자연어 처리 등 기술 발전으로 급성장하면서 산업용이나 인간을 도와주는 프런트용의 구분이 모호해졌다. 사용자가 어떻게 활용하느냐의 선택이 더 중요하다.
챗 GPT는 학습한 지식(data)을 대규모언어모델 (LLM, Large Language Model) 엔진을 기반으로 하는 문답(chat) 서비스다. LLM은 입력 텍스트를 기반으로 일관되고 의미 있는 언어를 생성하도록 설계된 일종의 언어 모델이다.
챗 GPT를 사용할수록 가속하여 학습되어 답변 실력이 향상된다. 엔진을 기본으로 다양한 차가 만들어진 듯 '챗 서비스' 이외에 음악, 그림, 프로그램 코딩 등 다양한 서비스가 생겨나고 있다. 정부나 기업 등 모두 필요한 목적으로 활용할 수 있는 자기만의 상품, 서비스를 만들 수 있다. 사실상 인류 문명 전반에 대변혁을 가져올 수밖에 없다. 챗 GPT의 간단한 문답 사례를 하나 보자.
▲ "KEPCO(한국전력공사)가 챗 GPT를 활용하여 할 수 있는 업무를 중요도에 따라 5개만 고른다면?"라고 챗 GPT에게 물었다. 3초 만에 나온 답이다.
KEPCO가 챗 GPT를 활용하여할 5가지 업무에 대한 실제 문답 화면 캡처
1) 데이터 분석 및 예측: KEPCO는 ChatGPT를 사용하여 한국 및 기타 국가의 에너지 생산 및 소비와 관련된 데이터를 분석하고 예측할 수 있습니다. 이는 KEPCO가 에너지원 및 분배에 대해 정보에 입각한 결정을 내리고 운영을 최적화하는 데 도움이 될 수 있습니다.
2) 고객 서비스 문의: KEPCO는 ChatGPT를 사용하여 에너지 청구 및 사용과 관련된 고객 서비스 문의를 처리할 수 있습니다. 여기에는 일반적인 질문에 답하고 정전, 계량기 판독 및 서비스 중단과 관련된 문제를 해결하는 것이 포함될 수 있습니다.
3) 에너지 효율성 및 지속 가능성 보고: KEPCO는 ChatGPT를 사용하여 에너지 효율성 및 지속 가능성에 대한 보고서를 생성할 수 있습니다. 여기에는 에너지 사용에 대한 데이터 분석 및 개선 영역 식별, 지속 가능성 목표를 향한 진행 상황 보고가 포함될 수 있습니다.
4) 규제 및 정책 분석: KEPCO는 ChatGPT를 사용하여 에너지 산업의 규제 및 정책 개발에 대한 최신 정보를 얻을 수 있습니다. 여기에는 제안된 규정 및 정책 분석, KEPCO 운영에 대한 잠재적 영향 식별 및 조치 권장 사항이 포함될 수 있습니다.
5) 언어 번역: KEPCO는 언어 번역, 특히 국제 커뮤니케이션 및 문서에 ChatGPT를 사용할 수 있습니다. 이를 통해 KEPCO는 다양한 국가 및 지역의 파트너, 고객 및 이해관계자와 효과적으로 소통할 수 있습니다.
이것은 챗 GPT가 KEPCO와 관련하여 지원할 수 있는 많은 작업 중 몇 가지 사례일 뿐이고, 중요한 특정 작업은 KEPCO의 목표와 우선순위에 따라 다를 수 있다고 챗 GPT는 말한다.
▲ 전 직원 일주일 동안 챗 GPT 사용하게 해야
"전 직원에게 하던 일 모두 중단하고 일주일간 '챗 GPT'만 사용하게 하세요. 하루는 무조건 자신만의 관심사를 가지고 사용하여 느낀 점을 정리해 보라고 하시고, 둘째 날은 문답내용을 미리 설정한 과제를 가지고 산출물을 만들어 보라고 하시며, 3일째는 자신 업무에 활용할 방안을, 그리고 4일째 되는 날에는 회사의 챗 GPT를 활용하여 신사업 등을 만들어 보라고 하세요. 그리고 이틀 동안은 토론을 하시지요. 물론 상금도 제시하시고요"
국내 유망한 중견 IT회사 대표에게 필자가 15일 저녁에 한말이다. 정부, 지자체, 기업, 학교는 물론이고 경제활동 연구활동을 하는 대부분의 국민이 '챗 GPT'를 알아야 한다. 그것도 깊이 제대로 알아야 한다. 큰 변화의 파도를 능동적으로 타야 한다. 해상도 좋고 편리한 스마트폰 카메라, 디지털카메라가 나왔는데도 '사진 필름'을 계속 만드는 우를 범해서는 안 된다.
▲ '챗 GPT-4' 등 업그레이드 버전 및 구글, MS 빙 등 맹추격
AI 챗봇 서비스 3사 비교 / 편집 작성 박대석 17일(현지시간) 뉴욕타임스 등 외신을 종합하면 현재 출시된 챗 GPT-3.5에 이어 챗 GPT-4로 업그레이드된다. 챗 GPT-4는 AI의 성능을 판단하는 기준인 매개변수(파라미터)가 현재보다 10배 이상 많은 1조 개가 정도라고 한다. 챗 GPT-4는 코딩 부문에 초점을 맞추고 있는데 이렇게 되면 사용자들이 원하는 복잡한 프로그램, 동영상 등을 쉽게 만들 수 있다. 챗 GPT-4가 메타버스 안에 들어가면 아바타가 자유로운 대화는 물론이고 가상공간에서 못하는 일이 없게 된다.
오픈 AI의 AI챗봇인 챗 GPT에 대응하여 구글은 유사한 AI챗봇 ‘바드’를 공개했다. 마이크로소프트(MS)는 챗 GPT의 성능을 개선한 AI챗봇을 탑재한 검색엔진 ‘빙’을 내놨는데 국내는 대기등록만 받고 있는 중이다. 챗 GPT와 MS 빙, 구글 바드는 운용되는 기반 언어 모델이 다르다.
챗 GPT에는 오픈 AI가 개발한 GPT-3.5가, MS의 빙엔 GPT-3.5를 업그레이드한 모델이 탑재됐다. 구글 바드에는 구글이 2년 전 개발한 대규모 언어 모델 람다의 경량 버전이 들어갔다. AI의 고성능을 보여주는 지표인 매개변수(파라미터) 수는 챗 GPT와 빙 챗봇이 1750억 개, 바드가 1370억 개다. 숫자만 보면 챗 GPT가 구글의 바드보다 나은 성능을 발휘할 것으로 보이지만 큰 차이는 없다.
가장 큰 차이점은 실시간 데이터를 결과물에 반영할 수 있느냐다. 챗 GPT는 2021년까지의 데이터만 학습해 실시간 데이터 반영이 불가능하다. MS의 빙은 1시간 전까지의 데이터를 반영한다. 구글 바드는 자세한 성능을 공개하지 않았지만, 최신 정보까지 반영할 것으로 추정된다.
챗 GPT는 답변을 하면서 정확한 출처를 밝히지 않는다. 하지만 빙과 바드는 답변 아래에 출처와 더 많은 정보를 직접 찾을 수 있는 사이트 링크를 표기한다. 기존보다 답변 신뢰도가 높아졌다는 평가가 나온다.
▲ 국내업체 맹렬 추격 중, 한글 유리하지만 글로벌로 가고 정부 능동적 지원해야
한국기업대 빅테크기업의 언어 비중 / 박대석 작성 현재 오픈 AI 챗 GPT는 한글로 사용하면 답변시간도 오래 걸리고 오류가 종종 발견된다. 나무위키 자료에 따르면 챗 GPT가 사용하는 데이터의 92% 이상은 영어로 되어있고 한글 데이터는 0.19%에 불과하다.
따라서 한글데이터가 많은 한국 기업들이 한국인 사용대상으로는 경쟁력이 높다. 하지만 국내 AI 기업들이 글로벌 회사로 성장하려면 영어데이터를 많이 가진 해외회사들과 연대할 필요가 있다. 절대적으로 필요한 일이다.
국내 기업들도 글로벌 빅테크에 뒤처지지 않기 위해 각자 수천억 원을 투자해 자체 개발에 나섰다. 보도에 따르면 네이버는 자사의 초거대 AI ‘하이퍼크로버’의 파라미터가 GPT-3(1750억 개) 보다 많은 2040억 개라고 밝혔다. 자연어(영어·한국어 등 일상에서 쓰는 언어) 데이터 학습량은 GPT-3의 6500배 이상이다.
네이버는 “GPT-3가 영어 중심으로 학습해 국내 기업들이 도입하기엔 한계가 있지만, 하이퍼크로버는 학습 데이터의 97%가 한국어다”라며 “우리나라가 AI 주권을 확보한다는 의미도 있다”라고 했다.
KT는 2017년 출시했던 음성인식 AI ‘기가지니’를 GPT-3을 뛰어넘는 초거대 AI로 발전시킬 계획이다. 후발주자인 SK텔레콤과 카카오는 지난 3월 서로 손잡고 초거대 AI 공동 개발에 속도를 내기로 했다. 1500억 개 파라미터를 갖춘 AI를 연내 개발하는 것이 우선적인 목표인 것으로 알려졌다.
LG는 올해 하반기까지 6000억 개 파라미터, 내년 상반기까지 1조 개가 넘는 파라미터를 갖춘 초거대 AI를 각각 만들겠다는 계획이다. 파라미터 수로만 보면 국내 최대 규모다. LG는 올해 하반기까지 6000억 개 파라미터, 내년 상반기까지 1조 개가 넘는 파라미터를 갖춘 초거대 AI를 각각 만들겠다는 계획이다. 파라미터 수로만 보면 국내 최대 규모다.
SK텔레콤은 대화형 AI 서비스 '에이닷'에 챗GPT 같은 초거대 AI 모델을 접목할 계획이다. 에이닷은 지난해 5월 SK텔레콤이 자체 개발한 GPT-3를 적용한 한국어 전용 서비스다. GPT-3는 사람처럼 대화하고 글을 쓰는 AI 모델이다.
사실상 초거대 AI사업은 궁극적으로 슈퍼컴퓨터 싸움이다. 정부는 후방에서 초거대 AI사업에 한국이 선도할 수 있도록 적극적으로 도와야 한다. 공연히 일부 부작용을 이유로 규제하려고 달려들면 안 된다. 챗 GPT 같은 초거대 AI 사업에 2등 몫은 거의 없다. 반도체처럼 한번 시장을 석권한 초거대 AI 기업이 사용자들이 딥러닝(deep learning)을 가속화하여 후발 주자는 영원히 따라갈 수 없기 때문이다.
칼럼니스트 박대석