ChatGPT & OpenAI의 딜레마

by 백기락


#챗GPT 열풍이 ... 1년이 넘어갑니다.


저에겐 아직 1년 미만이지만, 시간을 떠나서 챗GPT 이전의 세상이 기억이 잘 안 날 정도로 아득~합니다. ^^; 그만큼 영향력이 커졌다는거겠지요.


챗GPT를 개발한 #OpenAI 의 미래에 대한 장밋빛 전망은 대단합니다...만, 좀 지나칠 정도... 인거 같아서... 한 번 짚고자 글을 써봅니다.



ㅁ 기술력이 뛰어난(?!) OpenAI


OpenAI의 기술력이 뛰어난 건 사실입니다. #인공지능 관련 논문의 숫자 자체에서는 밀리지만, 인용횟수 측면에서는 압도적 우위에 있는 회사가 OpenAI 입니다. 그런 점에서 #생성형인공지능 에 필요한 핵심 기술을 정~말 잘 만드는 회사일 가능성이 높다는 것입니다.


그렇지만, OpenAI의 #GPT 기술은, 따지고 보면 #구글 이 개발한 #트랜스포머 라는 언어처리 기술에서 기인한 기술입니다. 구글은 검색 서비스의 강자답게 언어 처리 관련해서 다양한 논문을 많이 공개했는데요, 그 중에서도 트랜스포머 모델과 #BERT 모델은 현재의 언어 처리 기술의 토대라고해도 과언이 아닐 정도로 핵심적인 기술입니다. GPT 발표 이전까지를 놓고 본다면 #마이크로소프트 의 언어 처리 모델이 구글보다 좀더 앞서 있다고 평가를 받고 있었는데요, 그 기술조차 구글이 공개한 기술 - BERT 모델 - 기반으로 자기들이 응용한 것이었습니다.


지금의 인공지능의 수많은 출현에는, 구글 같은 회사들이 연구 결과물을 공개! 하는 문화가 매우 컸습니다. 2010년 이후부터 논문 및 기술의 공개 문화는 인공지능에 대해 정말 폭발적인 성장을 가능케 해주었습니다. (덕분에 중국도 열심히 따라올 수 있었습니다).


그런데 GPT4 부터 OpenAI는 비공개 모드를 취하기 시작했습니다. 그 이유까지는 여기서 쓰지 않겠습니다만, 이 문화가 큰 문제로 작용하기 시작합니다. #샘알트먼 을 물러나도록 할 뻔 했던 사건도 당시 이런 비공개 문화와 맞물려 있습니다. OpenAI는 그 회사명에서부터 '공개' 라는 문화 속에서 수많은 사람들이 참여, 투자한 것인데 그걸 비공개로 돌렸으니까요. 당장은 인공지능 분야의 여러 연구 결과가 여전히 공개되는 분위기지만, OpenAI 같은 회사들이 이런 식으로 나오면, 문화가 바뀌거나 최소한 OpenAI에 대해 견제하는 문화가 생겨날 가능성이 높습니다.



ㅁ영리하게 서비스 모델을 만들긴 했지만...


지금도 여러 생성형AI 서비스 모델 중에서 #ChatGPT 는 품질 면에서 매우 앞서 있습니다. 그런데 다들 이걸 기술만의 문제로 여기더군요. 이 점에서, 왜 우리가 인공지능 기술에 대한 이해가 필요한지, 를 고민해야 합니다.


OpenAI는 모델을 개발하거나 서비스를 개발하는 과정에서 일종의 엄선된 데이터셋을 사용합니다. 누가, 어떻게, 얼마나 투자했든 간에 엄선된 데이터셋이라는 건 사실입니다 .품질이 좋다는 뜻은 아닙니다만, 한정된 용량의 데이터셋을 전처리하고, 학습시켜서 개발했습니다. 이 말은, 결국 데이터셋의 용량, 품질에 따라 같은 모델로 더 나은 서비스를 개발할 수 있다는 뜻이 되는데, 아쉽게도 OpenAI는 그 작업을 스스로 충분히 모으는 데 한계가 있는 기업입니다. 그런 점에서 마이크로소프트와 구글은 OpenAI와 달리 어느 정도 #검색 과 #수집 과정을 거친 데이터셋을 사용하고 있습니다. 이 말은, 최초 전처리 전의 데이터셋을 모으는 데 유리한 고지에 있다는 뜻입니다. 당연히 #Google 이 압도적으로 유리합니다. 데이터셋이 커지면, 같은 모델, 같은 컴퓨팅파워로 학습할 때 더 오랜 시간이 걸리기 마련입니다. 그런 점에서 OpenAI가 학습 데이터셋의 규모 등을 공개하지 않는 건, 이미 #Microsoft 나 Google 에 비해 작기 때문일 것입니다. 한정된 데이터셋을 좀더 뛰어난 기술로 학습시킨다면, 당연히 좋은 결과가 나오겠죠? 하지만, 앞으로 점점 더 많은 데이터를 더 빨리 모을 수 있는 마이크로스프트, 구글과 비교할 때 압도적 기술 우위에 올라서지 않는 한 원 데이터 규모를 이기는 데에는 한계가 생길 수 밖에 없습니다.



ㅁ컴퓨팅 파워에서 너무나 불리한 OpenAI


뛰어난 인공지능이 탄생하기 위해서는 3가지가 필요합니다. 1. (빅)데이터 2. (뛰어난) 알고리즘/모델 3. (강력한) 컴퓨팅파워.


인공지능이 별도의 슈퍼컴퓨터에서 운영되던 시절은 지났습니다. 지금은 #클라우드 기반 위에서 움직이죠. 클라우드 시장에서 세계 1위 기업은 #아마존 이며, 2위는 마이크로소프트, 3위는 구글입니다. 1위와 2위 격차는 별로 안나구요, 2위와 3위는 많이 납니다. 아마존도 인공지능 분야에서 실력이 떨어질 것 같지 않습니다만, OpenAI 입장에서 아마존은 좀 결이 다른 경쟁자로 보일 겁니다. 오히려 마이크로소프트와 구글이 직접적인 경쟁자가 될 겁니다. OpenAI는 현재 MS #Azure 클라우드 를 저렴하게 사용하고 있는 것으로 알려져 있습니다. 그런데 MS는 클라우드 사업으로 돈을 많이 버는 - 구글도 마찬가지 - 회사입니다만, OpenAI는 아직 흑자가 아닌, 오로지 일부 유료 서비스 모델로 버티는 회사입니다. 회사 가치야 크겠지만, 엄청난 돈을 벌어 들이고, 인프라가 엄청나서 그 위에 AI를 돌리는 두 회사는 적자가 나도 다른 사업으로 메우지만, OpenAI는 투자금으로 아직 버텨야 합니다. 최근 수십 조 투자를 받겠다는 걸 보면, MS에서 벗어나고 싶은 모양입니다. 쉬울까 싶긴 합니다. 어디를 가더라도 MS가 처음에 투자할 때처럼 저렴하게 사용료를 책정하진 않을 것 같거든요 (생성형 AI 의 컴퓨팅량은... 어마어마합니다).



작년 초부터 저는 OpenAI, Microsoft, Google 및 #Naver 까지 다 써보고 있습니다. 전체 품질은 여전히 ChatGPT가 좋지만, 이미 Google과 비교할 때 격차는 크지 않구요, 계속 줄고 있습니다. 점점 구글의 #Gemini (이전 #Bard ) 가 더 뛰어난 부분이 많아지고 있습니다. Microsoft의 #Bing 품질은 여전히 아쉽지만, #Copilot 이란 이름으로 #Office 제품과 #Github 접목 등을 고려하면, OpenAI가 상상도 못할 정도의 파괴력을 서서히 발휘하고 있습니다. 그런 점에서 이번에 투자를 충분히 유치하지 못하면, 글쎄요...



빅테크 기업들의 경쟁 속에서 OpenAI가 사라질 것 같진 않습니다만, 지금의 드러난 분위기에 비해 숨겨진 요인들은 그리 밝지 않다는 걸 말씀드리고 싶어서 써봤습니다. 무엇을 보느냐, 에 따라 우리는 대응이 달라집니다. 그런 점에서 좀 냉정하게 바라보고 접근해야 하지 않을까, 싶어요.



오랜만에 기업 이야기를 써봤습니다. #시장조사 를 통해 #사업전략 등을 세운 경험들이 기업을 바라보는 시각을 조금은 다르게 만드는 것 같습니다. 여러분의 사업과 대응에 조금이라도 도움이 되면 좋겠습니다.



#BestJobDesigner


#백기락 Dream



* http://www.facebook.com/bestjobdesigner






Facebook

www.facebook.com








** http://band.us/@kirak






i_c07Ud018svc16py1muqahfbq_3rsuow.png%22&type=ff120

이미지 썸네일 삭제




백기락 BestJobDesigner | 밴드

안녕하세요 백기락입니다. 제가 주인공인, 유일한 제 개인 밴드랍니다. ^^ 제 이야기가 궁금한 분들은 누구나 환영합니다.


band.us








keyword
작가의 이전글신문이 신문 같지 않고, 기사가 기사 같지 않은 어느날