대화형 인공지능인 chatGPT가 구글을 대체한다는 말까지 나온다.
요즘 유튜브나 트위터에 chatGPT라는 인공지능 챗봇과 관련된 이야기를 한번이라도 봤다면 이 글이 조금이나마 궁금증을 해소해 줄 것이라 생각된다.
chatGPT가 등장하고 가장 놀라운 사실은, 서비스의 전파 속도이다.
100만 사용자를 만드는 데 걸린 시간
- 넷플릭스 3.5년
- 페이스북 10개월
- 인스타그램 2.5개월
- chatGPT 5일.
그런데, 왜 사람들은 이미지/영상 중심의 서비스 보다 훨씬 따분한 텍스트 기반의 챗봇에 열광 했을까?
추정컨데, chatGPT가 구글을 대체할지도 모른다는 이야기가 돌면서, 구글을 써온 수많은 사람들이 구글보다 편한 서비스가 대체 어떤 것인지 궁금했을 것이고, 그래서 구글을 쓸 때 많은 불편함을 안고 살았을 사람들이 새로운 방식을 시도해 봤을 것이다. (이건 다분히 개인의 추측에 불과하니 너무 의미심장하게 담아두지는 말기 바란다.)
그렇다면 사람들은 chatGPT에 어떤 기대감을 가질 수 있을까? 사용자 경험 측면에서 챗봇이 가지는 의미를 풀어 써 보면 다음과 같다.
1. 챗봇은 하나의 질문에 대해 하나의 답변을 해 준다. 챗봇의 답변을 들은 사람은 다음을 느끼게 된다.
1) 다른 답변을 볼 수 있는 선택의 여지가 없다. 선택할게 없다. 무한선택의 시대에 딱 편한 느낌.
2) 가장 정확한 최선의 답변을 했을 거라는 생각을 하게 된다.
2. 챗봇은 수많은 다양한 질문들에 대해서도 다 대답해 주므로 똑똑하겠구나 하고 생각하게 된다.
수퍼 스마트한 존재의 등장이다.
3. 사람에게 하기 곤란한 질문도 맘 편하게 할 수 있고, 언제나 질문 할 수 있어서 편하다고 느낀다.
4. 까다롭거나 디테일한 답변을 얻으려면, 똑똑하고 복잡한 질문을 해야 한다는걸 체험하게 된다..
이런 경험들은 직접 체험한 것이기도 하고, 챗봇에 대한 일반적인 사용자 경험에 해당한다.
다만 우리가 흔히 접하는 챗봇과는 다르게, chatGPT는
1. 언어 문법 및 표현력 학습을 위해서 토탈 1750억 단어가 포함된 데이터를 학습했고, (Pre-training)
2. 570GByte 정도 용량의 텍스트로 된 일반상식을 학습했다. (Transfer learning, fine-tuning)
3. 그리고 AI 스스로 문장을 깔끔하게 만들 줄 안다. (Natural Language Generation)
그래서 사람들은 구글신 만큼 똑똑하고 훌륭한 답변을 할 것으로 기대한다. 게다가 뭔가 비밀스러운 성공의 비밀을 알려 줄 것만 같은 신비감에 사로 잡히기도 한다. 다분히 신화적 상상력이 가미되어 chatGPT는 엄청난 파급력으로 대중들의 관심을 파고 들었다.
사람들은 열광 할 수 밖에 없다. 수없이 많은 정보와 컨텐츠 속에서 내게 필요한 유일한 하나의 정보를 위해 수없이 많은 링크를 열어봐야 하는 시대에, 답을 딱 하나만 제공해 준다는 것은 엄청 색다른 경험이다.
구글의 시대, 사람들은 확실히 다른 경험을 원한다.
설령, 그 정보가 불완전한 것이라 하더라도, 이전의 불편함을 해결해 줄 것이라는 기대감과 믿음이 있기 때문에 열광할 수 밖에 없다.
설령, chatGPT로 인해 정보의 검증방법이나 정보 대칭성이 훼손당하면서 다른 것들이 불편해 진다 하더라도, 지금 이순간 만큼은 열광할 수 밖에 없다.
설령 chatGPT가 권력자의 프로파간다로 활용되고, 특정 세력에 의해 장악 되어 정보를 왜곡 시킬 가능성이 높아진다 하더라도, 인터넷 활용에 익숙치 않은 사람들은 열광할 수 밖에 없다.
chatGPT는 AI 업계를 다시 붐업 시켜 줄 훌륭한 이슈 메이커가 될 뿐 아니라 훌륭한 기술들이 접목되어 AI 가능성과 기대감을 한껏 고무시켜 AI에 대한 기술 투자가 활발해 지는 좋은 기회를 만들어 내고 있다. 지금과 같은 이 타이밍에 chatGPT가 등장하고 StableDiffusion으로 시각적인 컨텐츠가 생성되면서 AI 업계는 인간을 대체할 창의적인 두뇌로 활동할 수도 있겠구나 하는 공포감과 기대감을 심어주고 있다.
하지만, 인간만이 가지는 비 합리적이고 비 이성적인 습성, 때론 스스로 자기 파괴적인 습성은 기계가 배우기 쉽지 않은 영역이다. 또한 chatGPT가 절대로 접할 수 없는 영역 가운데 하나가 비 언어적인 정보 체계에 대한 학습이다. 우리가 하루도 빠짐 없이 사용하는 언어, 그 언어의 한계를 언급한 비트겐슈타인의 말 처럼 우리가 설명할 수 없고 표현할 수 없는 영역은, 언어로써 어떤 진리 가치를 결정할 수 없는 신비한 영역으로 보았다.
chatGPT는 embedding(정보의 숫자화, 벡터화)이라는 과정을 거치며, 도메인이 다른 정보 표현을 숫자로 바꾸고 연산하게 된다. 표현하기 어려운 부분에 대해서는 결국 embedding에 어려움을 겪게 되고, 기계는 그런 미스테리한 신비의 영역에 대해서는 학습 할 수 없다는 결론에 쉽게 다다른다.
비언어적 정보들이 표현의 영역으로 들어오지 않는 이상 인공지능은 사람의 생각과 행위를 제대로 표현해 내거나 학습할 수 없고, 과학자들이나 AI 전문가들은 비언어적 정보를 어떤 식으로건 표현식이나 표현 방식의 형태로 분류체계를 만들고 구조화 하려 할 것이다.
요즘, 아는 후배와 같이 재미있는 스터디를 하고 있다. 인공 인간의 얼굴 표현의 한계점에 대한 것이다.
요즘 많이 쏟아지고 있는 인공인간, 가상인간, 디지털 휴먼의 표정을 살펴 보면 상당히 부자연 스럽다.
언뜻 보면 사람 같지만 말하고 표정짓고 표현하는 장면들을 볼 때 마다, 기술이 경지에 이르려면 아직 멀었다는 생각을 하게 된다.
비언어적 습성의 표현, 행동, 근육의 디테일한 움직임 등을 언어로, 또는 레이블로, 또는 데이터로 표현 하려면 그만큼 많은 노력과 관찰력이 필요할 것이다. 이것은 마치 찰스 다윈의 종의 기원이 만들어 놓은 자연계 생물 taxonomy를 구축하는 것과 마찬가지로 방대한 일이 될 것이다.
다른 관점으로 보면, 이런 비언어적 표현과 언어적 표현이 한데 결합 하면, 완전한 인공 인간이 만들어 지기 때문에 얼굴 표정 표현에 대한 taxonomy 구축을 시도해 볼 만한 가치는 충분하다. 엔터테인먼트나 게임산업에 미칠 파급력이 어마어마하기 때문에 깊이있게 공부하는 중이다.
여하튼, chatGPT는 몇가지 위에서 언급된 것 처럼 사용자 경험에서 전혀 다른 가치를 제공해 준다. 그리고 삶을 좀 더 단순하고 효율적으로 살 수 있도록 해 준다. 디지털 기술의 부작용이 낳은 정보의 범람, 그 정보의 범람을 해결할 또다른 디지털 기술이라고 볼 수 있다.
디지털의 디톡스는 결국 디지털이고 ...
우리가 사는 세상은 디지털과 같은 양자화 된 세상일거라는 믿음이 좀 더 굳혀지는 사건이다.
내일은 또 어떤 것들이 등장할까?
[Reference]
https://alphacode.deepmind.com/#layer=18,problem=3,heads=11111111111
https://www.noemamag.com/ai-and-the-limits-of-language/