brunch

You can make anything
by writing

C.S.Lewis

by Jamin Oct 07. 2024

게임 <디트로이트 비컴 휴먼> 과 인공지능에 대한 소고

(다시) 매일 글쓰기 (015/100)

최근 10년간, 시리 모먼트, 알파고 모먼트, 알렉사 모먼트 그리고 GPT 모먼트가 있었다. 딥러닝이 좀 알려지던 초창기, 고양이를 분류하는 것은 매우 흥미로웠지만, 대중의 반응은 애매했었다. 그래서 제품/시장 관점에서 내가 아는 한 저 4가지 정도를보고 있다. VUX 라는 분야를 고민하게 만든 시리나 알렉사. 손 발이 불편한 순간에도 우리가 시스템과 상호작용 할 수 있도록 만들어준 순간. TTS, STT 그리고 자연어 처리가 이를 가능하게 했을 것이다. 그리고 이제는 GPT 4o 와 함께 이건 더 강화되고 있고. 애플도 애플 인텔리전스를 내놓고, 메타도 AR 과 라마와 함께 계속 가고 있다. 


갑자기 옛날 소설 이야기. 옛 소설 <탐그루> 에서는 이러한 일들이, 언어를 모방하는 것이 곧 사람의 시뮬레이션이었고 따라서 이를 위해서 사람을 스캔하고 그것을 에뮬레이트 하는 것이 인공지능이라는 식의 전개를 펼쳤다. 실험적이고 흥미로운 작품이었는데, 요즘은 다시 구할 길이 없어 아쉽다. 여하튼, 지금의 LLM 의 경우 이렇게 사람의 언어 지능을 모사하는 것으로 시작해서 여러가지 감각기관을 재현하고 있는데. 


각설, 위의 세 순간들은 내가 기억하는 인공지능의 주요한 순간들이었다. 사실 인공지능을 어떻게 정의하느냐에 따라 더 많은 이야기가 있을 것이고, 또한 머신러닝과 같은 기술적인 방법론을 따지자면 더 학술적인 통사 연구가 가능하겠지만 이것은 최종 소비자에게 던지는 형태로만 의미가 있을 것이다. 또 한편으로는 SF 의 흐름을 더하여 문화적으로 어떤 사고 실험과 반응이 있었는지, ‘안드로이드는 전기양의 꿈을 꾸는가’ 와 <블레이드 러너> 까지 가볼 순 있겠지만 여기서는 일단 잠깐 홀드해두고.


다시, 알파고의 순간은 머신 러닝, 뉴럴 네트워크 등등 사람들이 주식에 투자하게 하고 많은 기업이 투자를 받고 또한 새로운 시대로 나아가게 만드는 주요한 순간이었다. 트랜지스터의 집적 만으로는 ‘체스’ 에서는 가능해도 ‘바둑’ 과 같은 영역에서는 쉽지 않을 것이다라는 부분. 인텔이었나 IBM 이었나, 왓슨 모먼트도 컸겠지만 그것은 나에겐 교과서의 일이었고 현 시대에서 내가 관측한 순간은 어쨌든 알파고와 이세돌의 대국이었다. 현재 시점에서는 작은 핸드폰 기기에 돌아가는 인공지능 만으로도 바둑 대회에서 큰 영향을 끼치는 문제가 있어서 이런 단속이 심해지는 - 일종의 머신 도핑을 하는 - 상황이라고 알고 있다.


인간은 기계보다 나은가? 여러가지 흥미로운 측면이 있지만 대체로 인간은 기계보다 못한 영역이 많다. ‘부분적으로는’ 예컨데 수를 세는 것도, 계산하는 것도 그렇고 알파고 시점 이후 지금까지 ‘사람’ 을 타겟으로 지엽적인 태스크를 수행하는 영역에서 기계는 인간을 엄청나게 많이 쫒아왔고, 앞으로 그 속도는 가속될 것이다. 물론 특정 개인의 경우에는 기계를 압도할 수도 있지만, 인간의 평균을 놓고 보자는 말이다. 


뛰어난 개성의 한 사람이 아닌 인류의 평균을 놓고 보면, 다양한 개별 태스크에서는 이제 인간이 기계보다 뛰어나다는 이야기를 하는 것은 오만한 경우에 보통 해당할 것이다. 이게 무슨 의미냐면, 사실 물리적 영역에서도 부분적인 능력으로만 놓고 보면 기계/로보틱스는 이미 인간을 뛰어넘었다. 유압 방식, 여러가지 모터 동력원 등등을 놓고 보면 말이지. 물론 어떤 세밀한 영역에서도 대체로 사람보다 개별 태스크에서는 유리하다.


개인적으로는 아직까지 사람이 할 수 밖에 없는 많은 영역도, 자본의 축적과 연구의 부실의 문제이지 따라잡을 수 있다고는 생각한다. 그 정도의 고도의 로봇을 설계하는 것이 그 정도로 중요한가의 인식의 문제에 가깝지 않을까. 예컨데 요리와 같은 영역은. 그 정도를 투자해서 얻을 수 있는 것이 제한적이고. 반대로 지금 요식업계에 나오는 로봇의 투입의 경우 단순 작업의 경우 인간 보다도 유리한 측면이 있고, 로봇 공학의 발전으로 가격이 싸지면서, 보다 더 적은 자본으로 시도할 수 있는 형태인 것은 아닐까. 사람의 인건비가 높아지는 까닭도 있을 것이다. 여튼, 각설하자면 사람은 기계보다 개별 작업 측면에서는 물리적으로도, 사고적으로도 이제는 따라가기 어렵다.


그럼에도 불구하고 문제는 늘 복잡하고, 하나의 태스크로만 이뤄져있지 않다. 복잡한 문제를 풀어서 단순화시키고 구조화하고. 프로세스를 설계하고, 혹은 문제를 파악하고. 의도라는 부분이 들어가야만 하는데. 이제 GPT 의 순간이 찾아왔다. 물론 이 생성형 AI 가 사람과 같이 의도를 파악하고 무언갈 수행하는 녀석은 분명 아니다. 하지만 복잡한 해석에 대한 답을 내놓아야 할 때, 단일 태스크를 넘어서 ‘언어’ 를 기반으로 수행할 수 있는 기반이 된 것은 사실이다. 


예컨데, 어떤 자료를 읽고 요약해서 발표 자료를 준비해야 할 때, 이 트랜스포머/생성형 거대 언어 모델을 허브로 하여서 다양한 인공지능이 ‘협업’ 하여 결과물을 가져올 수 있다. 건너 건너 들은 이야기, "웬만한 인턴보다 낫다. 처음 무언가를 실행할 때" - 컨설팅 업계 종사자의 말이었다. GPT 4o를 넘어서 o1 프리뷰 단계까지 간 지금은 과연 어떨까. 


사실 이런 챗봇 형태의 모델이 나올때마다, 마이크로소프트가 트위터에 공개한 경우에도 그렇고 사람들은 반달을 하기도, 어떤 측면에서는 스트레스 테스트를 하기도 한다. 인공지능이 공격을 받아서 여러가지로 헷갈리게 만드는 등의 역할들. 단순히 기능적으로 프롬프트 엔지니어링을 얼마나 잘해서 우리의 삶을 나아지게 만드느냐를 떠나 이것을 사람이라고 가정하고 대화를 하면서 이야기를 나누는 순간들. 어떤 경우에는 학습자의 보조 장치로, 어떨 때는 상담사의 역할을 할 수도 있지 않을까 기대하며. 게임의 경우에는 좀 더 급진적으로 특정 NPC 를 연기하도록 할 수 있지 않을까 하는 기대의 순간들이 생겨났다.


예컨데 이제 정말로 롤플레잉이 가능한 게임이 나올 수 있을 것이다. 현재 유행하는 <발더스 게이트3> 같은 게임은, 이미 정해진 시나리오 아래에서 선택지를 통해서 게임을 풀어가는 CRPG 이며 이는 TRPG 의 전통을 계승한 것이다. 그리고 예전의 테이블 탑 롤플레잉 게임의 경우 주어진 규칙에서 던전 마스터가 상황을 설정하고 대화를 통해서 게임을 풀어나가고, 시나리오에 기반하여 플레이어에게 선택지를 주고, 이것을 플레이어가 대답을 통해서 가끔은 주사위를 굴려서 결정할 수 있게 하는 방식이며, 말 그대로 역할극 이었다.


컴퓨터로 이 게임의 형태가 옮겨 가면서, 그래픽적으로 상상력을 대신하는 장치를 만들기 전 부터, 던전 마스터의 역할을 계산기 - 컴퓨터가 대신하게 하였고. 생성형 AI 이전에는 사전에 프로그램된 규칙과 텍스트를 기반으로 이 역할을 수행하였는데, 이제는 이것을 GPT 와 같은 거대 언어 모델이 대체할 수 있다는 말이다. 사실 이미 GPT 를 기반으로 하는 텍스트 기반 RPG 게임은 나오고 있고 - 구독 비용이 제법 비싸니까 아직 제대로는 못해봤다. 무엇보다 영어라서 - 이는 재미있는 상상을 여럿 가능하게 했다. 


다시 - <발더스 게이트3> 에서도 이런 방식을 고민했다는 기사를 본 기억이 있는데. 만약 이게 정말로 비용 효율성을 달성하고, 개개인의 기기의 GPU, NPU 혹은 무엇이라도 가속기가 충분하고 잘 보급되면 모두가 같은 배경의, 같은 규칙의 게임을 하지만 전개는 완전히 다른 무언가가 생겨날 수 있지 않을까. (NC 같은 기업에서 인공지능 투자를 많이 한다던데 이런 연구도 하고 있을까)


이런 내용은 결국 참여형 미디어로 게임의 가능성이 극대화되는 부분일 것 같은데. 상호작용의 예술이라고 볼 수 있는 게임, 그리고 그 안의 서사성 까지도 상호작용에 의해서 완전하게 변화하는 무언가는 정말로 새로운 시대의 미디어, 작품으로 기능할 것이라는 추측을 하게 만든다. 예술가가 해야 할 역할은 판을 까는 것이고, 참여를 통해서 완성되는 예술. 현대 예술의 한 면에서 지향하는 어떤 무언가가 완성되는 순간이 아닐까 싶은데.


이 분야가 사실 인공지능 이전에도 게임에서는 잘 연구되고 다듬어지고 있었고, 비교적 최신 게임인 <디트로이트 비컴 휴먼> 에서 잘 드러난다. 퀀틱 드림이라는 프랑스 게임개발사. 만화를 예술의 영역을 잘 정의하던 예술가의 나라여서 그런지, 게임을 예술로 만드는 데 여러 갈래 중 하나인 인터랙티브 스토리텔링을 흥미롭게 잘 풀어낸 작품이었다.


서사와 UX를 기반으로, 극중극, 액자형 구성에 가까운 방식으로 사람을 실제 이야기의 관찰자로, 혹은 그 안의 주인공들을의 롤플레잉을 돕는 사람의 방식으로 몰입하게 만든 구조는 훌륭했고 당시로써 최신의 게임기를 활용한 그래픽도 사람을 몰입하게 하는 데 주요한 장치가 되었다. 물론 여러가지 제한이 있기에 비교적 선택 분기 이전의 플레이가 선형적일 수 았는 한계가 있지만 - 반대로 <젤다의 전설: 야생의 숨결> 의 경우 완전 직선적이고 고정된 스토리였지만 플레이는 완전히 비선형적이다 - 그 단점이 느껴지지 않도록 - 그러니까 우리가 잘 만들어진 영화에 몰입하는 경험에 더하여 QTE 와 같은 반응을 이끌어내고 몰입하도록 만들어낸 부분이 흥미로웠다.


이제 여기에 ‘아마도’ 언젠가 퀀틱드림이 혹은 다른 누군가가 생성형 AI 를 도입하겠지. 어쩌면 <발더스게이트3> 의 라리안 소프트가 먼저일 수도 있고. 하지만 오늘은 <디트로이트 비컴 휴먼> 을 말하고 싶은데, 왜냐면 그 소재와 주제 자체가 인공지능에 대한 것이었으니까. (그리고 이미 작은 시도들은 계속 나오고 있고)


이 작품의 이야기는 어쩌면 다양한 SF 에서 이미 충분히 말하고 논의된 영역이라고 비판할 수 있을 것이다. 사실 새로울 것이 있느냐고, 영화나 소설의 비평계에서는 폄하하기 좋다고 생각한다. 인공지능이 자아를 가진다면 어쩌냐? 그럴 때 이들을 새로운 종족으로 받아들여야만 하는가? <사상 최고의 보안관> 이란 작품에서 ‘글쟁이S’는 다른 SF 를 참고하여 감정을 느끼는 순간을 기점으로 안드로이드와 휴머노이드를 나눈다고 설정했다. 


<플루토> 에서 우라사와 나오키와 (기억나지 않은 스토리 작가는) 데즈카 오사무의 <지상 최대의 로봇> 에서 따오면서 이어서 - 로봇이 처음 느끼는 감정은 주로 증오/공포라고 서술하는데, <사상 최고의 보안관> 에서도 비슷하게 공포라는 것이 주로 파괴되기 직전, ‘나’ 의 소멸이라는 순간에 느끼기 때문에 안드로이드와 휴머노이드를 구분하기 어렵다는 식의 서술이 있었다.


마찬가지로, <디트로이트 비컴 휴먼> 에서도, 갈등의 순간 - 박해의 순간에 안드로이드는 각성한다. 작품에서는 ‘불량품’ 이 되었다고 하는데. 이 장면을 직접 플레이하면서 스스로 각성하게 만드는 연출 - 그러니까 플레이어가 안드로이드의 입장에서 안드로이드가 아니야! 라는 식의 선택을 하도록 만드는 연출은 훌륭했다. 어쩌면 전술한 것처럼 서사는 그렇게 새로울 내용은 없지만, 그래도 그 이야기 동안에 플레이어 - 작품의 참여자를 안드로이드라는 롤플레잉을 하도록 만들고 그를 통해서 감정이입과 선택을 하도록 유도하는 부분이 아름다웠었다.


특히, 매우 초반에 한 안드로이드가 미술 작가의 아래에서 그림과 피아노를 배우는 등 하는데, 작가는 묘사하듯 따라 그리지 말고 그냥 무언가 그리고 싶은 것을 그리라고 하는 순간이 있는데. 이 때의 기분이 플레이를 다 끝내고 나서 여러가지 생각을 하게 만들었다. 왜냐면, 생각보다 고대인 혹은 어린 아이들이 그림을 그리거나 할 때에는 추상적인 것 보다는 ‘따라 그린다’ 는 이야기를 들었기 때문인데. 자아의 형성과 학습을 통하여 우리가 ‘원하는 것’ 을 사고하고 꿈꾸면서 발전한다고 했을 때 그 이전은 ‘모방’ 하는 것이라고 배웠기 때문이다.


뇌과학 책을 열심히 읽진 않았고, 논문을 읽은 것은 아니니 애매하지만. 관련 책을 읽던 기억이 떠오른다. 그 중, 우리에게는 ‘거울 신경’ 이 있다는 표현이 기억난다. 어린 아이부터 우리가 계속해서 ‘dna’ 에 코딩되지 않은 외적인 문화적인 혹은 관습적인 무언가를 배울 수 있는 근간은 ‘따라하고자 하는’ 무언가가 있기 때문이라고 했다. 


예컨데, 귀여움이란 나약할 때 생존하기 좋은 방식이니 아이가 웃거나 우는 것 자체는 어쩌면 우리의 유전자 안에 남아있는 무엇일 수 있겠지만. 아무리 유전자가 잘 코딩되어 있어도 말하는 방식과 사고의 형태가 남아 있지는 않다. 그러니까, 유전자는 하드웨어 복제의 역할이니까 복제자, 전달자로의 Gene 이고, 리처드 도킨스가 말한 Meme, 문화적인 복제소가 역할하는 근간은 이 ‘거울 신경’ 그러니까 따라하려고 하는 무언가가 아닐까.


그런 면에서 다시 GPT 로 오면 사람들이, 개발자들이 이 생성형 AI 가 사람을 따라하도록 계속 만들고 있는데. 어쩌면 언젠가는 우리를 꽤나 완전하게 모사하는 상황까지 갈 수도 있지 않을까 싶다. 그러나 개개인의 자아, 나라는 것은 결국 나와 단절된 세계를 구분짓고 상상함으로써 존재한다라고 하는데 (<키메라> 이영도) 나를 인식하고 소망할 수 있을지는 사실 미지의 영역이긴 하다. 그럼에도 모사가 우리의 정신적인 후계를 만드는 방식이라는 것이 참이라면, 이 인공지능들의 모사의 끝은 휴머노이드가 되는 것은 아닐까 싶은데. 그 때가 올 수 있을까, 온다면 그들은 인간을 보고 무슨 말을 하게 될까 여러가지 생각을 하게 된다.


존재란 무엇인가. 통속의 뇌가 우리인가. <폴라리스 랩소디> 에서 ‘라이언’ 은 정체란 무엇인가, 내 지위인가 이름인가 내 꿈인가 꿈을 향해 가는 길인가’ 라는 식의 표현을 했는데. 후자로 갈 수록 물리적인 인간이라는 굴레 보다는 결국 뇌라는 단백질 속에서 일어나고 있는 작용들이 나인 것은 아닐까 싶다. 한편으로 물리학적으로 빅뱅 이후 시간은 결정된 것은 아닐까 싶다는 생각과, 그러나 이 온 우주의 입장에서 미시 영역 - 양자의 영역에 가깝게 작은 나의 모든 것이 결정될 수 있는 것일까 하는 생각도 들고, 최종적으로는 가능성의 측면에서 우리가 알 지 못하는 여러가지와 같이 현재의 AI 의 가능성에 대해서도 예단할 필요는 없지 않은가 생각도 해보는데.


그럼에도 래리 페이지와 세르게이 브린이 구글의 사이트의 이스터에그로 스카이넷이 스스로를 찾지 못하도록 하는 식의 표현을 한 것이 다시 떠오른다. 그냥 그렇다는 이야기.


각설, 그래서 <디트로이트 비컴 휴먼> 을 지금 다시하면 어떨까. 다른 비평에서는 이를 ‘흑인 해방’ 의 비유로 해설한 것을 보았는데, 스토리만 놓고 보면 완전히 그렇긴 하다. 우리가 예전에는 피부색이 다른 존재를 어떻게 대했을까? 노예로 존재하던 때의 그들은 안드로이드와 다를 게 있었는가? 우리가 인권을 정의할 때 그 범위를 확장하기 위해 엄청 노력했고 - 지금도 하고 있는데 이게 종으로의 사피엔스를 넘어설 가능성은 없을까? 

여러가지 생각이 들게 만든다. 그래서 지금 다시 한다면, 단순히 이야기로의 몰입, 다양성에 대한 고민을 뛰어넘어 진정으로 우리가 앞으로 살 미래에 대해서 고민하게 되지 않을까 하는 생각을 하였다.



초고: 2023.08.27

탈고: 2024.10.03

매거진의 이전글 <리모트: 사무실 따위 필요 없어>를 읽고.
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari