Ep 14. AI를 위해서 우리가 눈감아주는 것들 (feat. 올트만)
여러 국가들이 미-소 냉전시대의 ‘무장 경쟁 (arms race)’을 연상시키는 ‘인공지능 개발 경쟁’에 뛰어들고 있다.
인공지능과 저작권이란 이슈에서 현재 가장 쟁점이 되는 부분이 바로 ‘훈련 데이터’이다.
국가적으로 세부내용은 상이할 수 있으나 보편적으로 인공지능의 훈련 기간 중 연구 목적으로 사용되는 데이터들은 적법한 사용으로 ‘공정사용’의 범주에 포함시킨다. 하지만 이런 훈련을 통해 개발된 인공지능모델이 상업적 목적으로 활용될 때는 같은 기준을 적용시키기 어렵다.
특히 TDM, Text-Data-Mining[텍스트-데이터-마이닝]에 대해서는 좀 더 ‘느슨한’ 태도의 규정이 있는 것으로 보이나 실제 소송 사례들을 보면, 인공지능회사들의 안일한 점이 느껴진다.
그 안일함은 벌써 51개나 되는 소송 건수가 증명한다.
우선 ‘인터넷에 공개된 자료’, 예를 들면 검색가능한 일반블로그의 자료들 모두, 검색 가능한 공개된 자료라고 하더라도 ‘저작권이 없다고 해석할 수 없으며, 그런 텍스트 자료를 작성한 이들 역시 자신들이 쓴 글이 인공지능 개발에 활용될 것에 사전동의를 한 것도 아니다. ‘레딧(reddit)’과 같은 인공지능개발 회사들이 사용한 자료들이 올라가 있는 웹서비스 역시 사용자약관에 ‘인공지능 개발에 활용 될 수 있음’에 대한 고지가 없었기 때문이기도 하다.
이런 사용에 대한 책임을 묻는 자리에서 인공지능 회사는 훈련단계에서 이 데이터들이 정확히 어떻게 사용되는지 모른다는 주장, 즉 소위 ‘블랙박스’라고 불리기도 ‘복잡성’에 촛점을 두는 변론을 하거나, 생성형 AI의 생성물이 원저작물을 ‘활용’하여 변형된 것이라며 공정사용을 주장하기도 한다.
지난 글에서 언급된 적이 있지만 다시 한 번 살펴봐도 "블룸버그 인텔리전스"에서 보도한 손해배상액 예상액에 놀라지 않을 수 없다.
반면에 훈련데이터를 공개하라는 입장을 마주할 때는 ‘영업기밀’이라며 공개할 수 없다고 항변한다. 이렇게 저작권자의 권리와 인공지능기업들의 권리를 대할 때 이중적인 잣대를 들이대는 듯한 모습을 볼 수 있다.
구글 다음으로 가장 유명한 인공지능회사인 오픈AI가 대표적인 사례가 될 수 있겠다.
마침 지난 수년간 오픈AI를 비롯한 실리콘밸리의 300여명의 인사들과의 인터뷰를 바탕으로한 책을 발표한 저자의 강연을 듣게 되어 기존에 모르고 있던 내용들을 많이 접할 수 있었다.
구글이 딥마인드를 인수할 무렵, 영리기업이 전인류에게 공평(?)하게 제공되어야할 인공지능이 독점되는 걸 우려하는 이들이 있었다. 구글의 대항마를 오픈소스로 만들기 위해서(라며) 샘 올트만은 일론 머스크와 기타 인공지능업계의 주요인물들을 영입하여 ‘오픈AI’가 시작되었다.
오픈AI는 비영리적(non-profit) 단체로 시작되었고, 당시에 ‘오픈소스’로 연구되고 개발되었다. 그리고 지금은 비영리 단체 내 영리조직(capped profit)이 생기는 기형적인 구조가 되어 문제가 되었다.
비영리기관 속에서 시작된 영리 조직과 영리활동과 관련하여 일론 머스크와 의견 충돌로 일론 머스크가 나가고, 그 후에는 마이크로소프트의 투자를 받았다. 이렇듯 그 시작이 연구 목적이라도 어느 시점에 상업모델을 내놓게 된다면 ‘공정사용’의 범위에서 벗어나게 된다.
처음에는 사기업인 구글에서 딥마인드(DEEPMIND)를 인수한 것을 “인류의 위기’로 정의했던 샘 올트만. 오픈AI가 사기업이 되자 이번에는 ‘중국이 개발하는 인공지능’이 인류의 위협이라고 설명한다. 그렇게 소련과의 냉전과 같은 프레임으로 인공지능 개발 경쟁에서 선두주자가 되어야한다는 주장을 하며 투자자들과 미국정부의 자금을 끌어들인다.
그런 그가 이제는 ‘사기업(구글)’의 인공지능이 아닌 중국이 인공지능 패권국이 되는 것을 인류의 위기인 것처럼 이야기 한다. 그런 관점으로 트럼프 대통령의 당선 후에 정부의 지지를 받아내기도 했다.
(그는 기술자이기 전에 최고의 펀드레이저라고 불리기도 한다)
그와 만난 바 있는 실리콘밸리의 여러 인사들을 인터뷰한 캐런 하오는 이상한 점을 발견했다고 한다. 그녀가 인터뷰 한 사람들은 인공지능에 대해 다 서로 다른 비전을 가지고 있었다. 하지만 그들이 샘 올트만과 만났을 때 자신들의 비전에 동의하고 같은 비전을 가지고 있었다고 생각했다는 거다. 인공지능을 안전하게 개발하는 것에 촛점을 두었던 여러 사람들이 샘 올트만과 함께 일을 하기 시작했지만 후에 '속은 기분'으로 그를 '방출'하게 된 것의 배경이 여기에 있는지도 모르겠다.
캐런은 샘 올트만이 목적을 달성하기 위해서는 필요한 말, 상대가 듣고 싶어하는 말을 할 수 있는 슈퍼 파워가 있다고 한다.
그녀는 말한다.
샘은 진실과 느슨한 관계를 유지하고 있다고
Sam has a loose relationship with truth.
우리가 인공지능의 편리함에 주목할 때, 캐런 하오는 실리콘밸리에서 ‘인공지능’이란 이름의 ‘제국’이 움직이고 있다고 주장한다. 대부분의 AI 회사들은 전통적인 ‘제국’처럼 움직이는데 그 특성을 다음 네 가지로 설명한다.
(1) 자원의 착취 - 동의 없이 공공 영역의 데이터를 사용한다
(2) 노동의 착취 - 머신러닝시 필수인 데이터 라벨링과 콘텐트 검열을 저임금노동자를 통해 진행한다
(3) 지식의 독점 - 인공지능 회사들은 대부분의 AI인재들을 흡수한다. 그리고 그 후 대부분의 연구는 독립적 학술의 영역이 아닌 기업의 이윤을 위해 이루어진다.
(4) 문명화 사명감 - 인공지능회사들은 인류를 구하거나 발전시키기 위해서라는 사명을 주장하며 자신들을 ‘악의 제국’과 싸우는 선한제국으로 규정한다. 예를 들어 중국이 ‘악의 제국’이 되고, 자신들은 선한 제국으로 규정한다.
위 내용들이 추성적인 개념이라고 하면 다음은 보다 현실적으로 다가올 수 있겠다.
지금까지의 인공지능 시스템은 시스템의 ‘고도화’가 아닌 ‘거대화’를 통해 성능을 높여왔다. 더 많은 칩을 넣고 더 큰 데이터센터를 짓는 것만으로 ‘더 좋은 시스템’이 나온는 스케일링 법칙을 이어왔다. 그리고 데이터센터에서 소모되는 자원은 일반인들이 쉽게 떠올릴 주제가 아니다.
하지만 데이터센터에서 소모되는 전력, 그리고 냉각을 위해 필요한 담수 소비량은 엄청나다. 특히 당신이 지구온난화, 기후위기, 탄소중립 등의 키워드로 위기의식을 가지고 살아왔다면 생성형AI와 ‘노는 것’에 부담을 느껴야 할지도 모르겠다.
오픈AI에 대한 조사를 할 때, 한국에선 그다지 주목받지 못한 사건도 알게 되었다. .오픈AI에서 연구원으로 근무한 적 있던 직원이 뉴욕타임즈와 인터뷰를 한 후, 사망한 사건.
2025년 1월 경, 미국의 한 정치인/유튜버 터커 칼슨은 사망한 직원의 어머니와 인터뷰를 하며 유족이 제시하는 의혹들을 알렸다. 그 후 수개월이 지난 9월, 이 채널에 샘 올트만이 직접 출연하기도 한다.
탐탁치 않은 사건은 또 있다.
여동생인 앤 올트만이 샘 올트만과 다른 형제가 자신이 3세 때부터 Sexual Abuse를 했다며 고소한 사건이다. 샘 올트만은 여동생의 주장이 허구라고 말하며 그녀가 정신질환을 앓고 있다고 말한다.
(Source: The Guardian)
https://share.google/qjf5NPlg4k3SSUe0d
https://fortune.com/2025/01/08/openai-sam-altman-sister-rape-sexual-abuse-court-case-lawsuit/
몇 개월전 내가 봤던 인터뷰에서 앤 올트만은 이런 얘기를 했었다.
자신의 두 남자 형제들은 돈 버는 것에 관심이 있고 금융지능이 높았던 반면, 자신은 그런 것보다 창의적인 것에 더 관심이 많은 '미운 오리 새끼'였다고.
어떤 일인지 그 인터뷰 영상은 인터넷에서 사라졌다.
대기업은 물론 CEO동생보다 CEO의 의견을 더 중요시 하겠지만
2025년 10월.
샘 올트만이 현 정권과 만나고 있을 때, 청와대에선 이런 배후의 이야기들을 알고 있었을까 궁금했다.
https://www.hani.co.kr/arti/politics/bluehouse/1221858.html
국정원에서 알아서 잘 했겠지 싶으면서도......
검색되지 않고 묻히는 이야기라 몰랐을 것 같기도 하고......
실리콘밸리 최고의 “펀드래이저 fundraiser”로 불리는 샘 올트만.
10년 후, 우리는 그에 대해 어떤 것들을 기억하게 될까.
우리나라 미래수석과 대통령님께서 어련히 알아서 하시겠지요…
원래 AI DOOMER(비관론자) 로 알려져 있던 그는 어느 시점을 개기로 톤이 달라졌다고 알려진다. 무엇이 달라진 걸까? 그가 말하는 것과 그의 진심은 어느 정도의 거리를 두고 있을까?
어쩌면 이 역시 시간이 증명해낼지 모르겠다.