brunch

'AI 민주화'라는 아이러니, 그리고 변증법

문과지만 기술하는 해설서

by 박 스테파노

아주 좋은 의제가 올라왔는데, 기술 영역에 밖에 있는 분들의 이해가 쉽지는 않은 것 같습니다. 우선 컴퓨팅 시스템의 '개방성'과 '폐쇄성'이라는 것이 말뜻은 알겠지만 쉽게 이해되는 것은 아닐 것입니다. 외부면 몰라도 이곳의 많은 독자들이 제법 연령대가 있는 분들이고 전문 종사자들의 수는 한정적이기 때문이지요.


그래서, 좀 더 쉬워 보이는 기사를 급하게 찾았습니다. 이도 전부를 읽어 내기에 약간의 인내가 필요해 보입니다. 이를 기반으로 문과생 출신의 말로 풀어 볼까 합니다. 기술적 이해는 밀어 두시고, 일상과 사회에 대한 의미로 생각을 나누고자 합니다.

Democratic AI (사진=Contio Humana)


"누구나 쉽게 접근할 있는" Vs "그만큼 위험에 노출된"


http://www.aitimes.com/news/articleView.html?idxno=146505


'달리2(DALL-E2)'를 비롯한 이미지 생성 인공지능(AI) 모델이 폭발적 인기를 모으고 있는 가운데 최근 오픈 소스로 공개된 새로운 이미지 생성 모델을 두고 논란이 일고 있다. -기사 본문 중-


AI의 민주화란 "접근성"과 "폐쇄성"을 대표적인 키워드로 이야기합니다. 이를 좀 더 풀어쓰면 '누구나 쉽게 접근해 쓸 수 있는' 인공지능과 '위험성이 존재하니 접근을 제한하여 사용하는' 인공지능에 대한 논쟁입니다.


사실 이는 오래된 IT 시스템 개발과 운영에 대한 가치관,

철학적, 그리고 실효적 입장의 차이였습니다. 웹 개발, 즉 인터넷상에 무언가를 구현할 때, 그리고 서버나 운영 시스템이 연동되어 작동하기 위한 설정을 할 때 보통 크게 두 가지의 방법이 있습니다.


기성품인 패키지화된 기성품을 쓸 것이냐, 아니면 오픈소스라고 하는 누구나 접근 가능한 소스들을 조합하여 나만의 개발도구로 쓸 것이냐의 갈림길입니다. 아주 쉽게 비유하자면 기성품 PC를 살 것이냐, 내가 부품을 소싱해 조립 PC를 만드냐를 '소프트웨어'관점으로 견주어 보면 됩니다. 둘 다 장단점이 있고 지지하는 사람들도 나뉩니다.


논란의 가운데에 영국의 스타트업 스태빌리티 AI가 지난 8월 공개한 이미지 생성 AI 도구 ‘스테이블 디퓨전’때문입니다. 이 생성도구의 소스코드를 오픈소스로 공개한 것이지요. '누구나 AI에 접근하고 쓸 수 있게 하자'는 의미로 캐치프레이즈를 만든 것이 '민주적' AI입니다. 새로운 붐업을 기대하여 오픈소스로 내놓았지만 오히려 이를 악용한 사례가 이어지고 있는 것이 문제입니다.


회사가 공개한 후 개발자들은 마음대로 스테이블 디퓨전의 코드를 복제해 쓸 수 있게 되었습니다. 물론, 자연어 분석이나 음성 분석의 언어 AI모델이 오픈 소스로 공개된 적은 있었습니다. 그러나 이미지 생성 AI 모델이 개발자는 물론 일반인들에게도 오픈 소스로 공개된 것은 처음입니다.

스테이블 디퓨전을 사용한 이미지 (사진=테크튜브)

일반 사람들의 일상은 이 지점이 중요하게 다가옵니다. 빅 테크가 '민주화' 캐치 프레이즈를 악용해 정작 비 민주적인 경영 전략에 이용하기에, AI의 민주적 생태계가 위협을 받는다는 거대 담론은 달나라 이야기처럼 들릴지도 모릅니다. 한국의 빅 테크에 AI전문 기업은 있지도 않으며, 미국 본토의 그들의 속셈이 일상에 스며드는 일을 구체적으로 상상하기도 어렵기 때문이지요.


스테이블 디퓨전이 공개된 지 보름 만에 아트브리더, 픽셀스.ai, 미드저니 등 다수의 아트 생성 서비스에 채택되는 성과로 이어지기도 했습니다. 반대로 대표적인 음모론 웹사이트에 이 도구를 이용한 '가짜 또는 혐오 사진'이 올라오는 부작용도 나타나고 있어서 논란에 서게 되었습니다.


실제로 악명 높은 음모론 토론 게시판(4 chan)에서는 유명인의 AI 생성 누드 작품 및 기타 형태의 포르노가 게시된 바가 있습니다. 스테이블 디퓨전은 사용자의 작업을 최소화하면서 완벽하지는 않지만 속아 넘어갈 정도의 설득력 있는 가짜 이미지를 생성해 줍니다. 이 시스템의 특징은 설치가 간편하고 고사양 그래픽 카드가 필요 없다는 것입니다. 맥북에서 실행할 수 있는 보다 효율적인 퍼블릭 버전의 공개도 진행 중이니 문제는 더 확산될 수 있습니다. 사실의 해석을 두고서도 논쟁이 심한데, 이제 기계가 만든 가짜 콘텐츠를 맞이 하게 된 것이지요.


이와 같은 개방적 접근 방식은 달리2를 만든 오픈 AI나 이마겐을 개발한 구글과는 정반대 방향입니다. 이들 두 이미지 생성 AI모델은 악용 가능성을 우려해 일반인의 접근을 제한하고 코드도 공개하지 않은 "폐쇄형 시스템"을 유지하고 있기 때문입니다. 확장과 전파의 한계보다 악용과 기술적 난잡성의 위험도를 더 고려한 방침이라 평가됩니다.



문제는 담론이 아니라, 실재하는 일상


"민주화" 또는 "개방성"을 강조하는 진영은 그저 '편리'라는 효용을 초월한 '담론'으로 주장을 정당화하려 합니다. 소수의 거대 기술 기업-빅 테크들이 독점적으로 AI모델을 통제해선 안된다는 것이지요. 보다 많은 사람들이 더 자유롭게 쓸 수 있도록 해야 한다는 '민주화'의 담론을 꺼냅니다. 모스타크의 주장을 전했다. 이번 논란의 스태빌리티 AI의 CEO도 같은 주장으로 인터뷰를 한 적이 있습니다.

빌드2019 기조연설 중 "AI 민주화의 첨병"을 선언한 사티야 나델라 MS 회장 (사진=벤처스퀘어)

이런 주장은 고귀해 보이기 때문에 그럴싸해 보입니다. 미디어에서 헤드라인으로 잡기 쉬운 주제입니다. 그리고, 개념과 이론, 전 사회적인 고찰은 필요해 보입니다. 그런데, 이런 '담론'은 늘 '일상'을 비껴가기 일쑤입니다. 민주화와 대중화가 뒤편에 남긴 '위험성'은 우리의 일상에 바짝 다가오기 마련이기 때문입니다.


AI는 현재 우리의 생활에 깊숙이 들어와 있습니다. 금융ㆍ통신 회사의 대고객 창구는 'AI 챗봇'이 동어반복 상담에서 사람이 숨어 있는 듯 자연스러운 상담까지 진화되어 자리 잡고 있습니다. 대출심사, 보험계리, 저작권 변리, 컨설팅 레퍼런스 작성, 판사의 판례 검토 등 일상으로의 범주를 넓히고 있습니다.


뿐만 아니라, AI가 글도 쓰고, 그림도 그리고, 영화도 만드는 기술적 완성도는 이미 정점을 이루고 있습니다. 범죄 패턴을 예측하고 사건 사고를 예방하며, 일상 속의 먹거리와 볼거리를 척척 추천해 주는 세상입니다. 참 편리하지만 곰곰이 생각하자면 섬뜩한 생각이 듭니다. 그야말로 'AI의 시대'가 시작된 것이지요.


이와 같은 기술적 편의는 사용자와 운영자가 최소한 '선한 존재'라는 가정에서만 가능합니다. 사람과 주체의 욕심과 잘못된 의도에 따라 악용될 가능성도 높아집니다. AI가 가짜 뉴스를 발생하거나, 그를 이용한 거짓 캠페인에 이용되거나, 피싱ㆍ스미싱을 접목한 신종 인터넷 사기의 도구가 될 수도 있기 때문입니다.



'AI 민주화'라는 아이러니


디지털 기술은 데이터를 처리하는 기술이 핵심이 되었습니다. 특히 소프트웨어 기반의 프로그램 시스템의 개발이 그 성과로 이어진 것입니다. 프로그래밍은 본디 태생이 연구자들과 해커들의 공수 공방의 진화입니다. 그것이 산업의 진영으로 들어와 영민한 IT 기업들이 소프트웨어를 상품화하고자 합니다. 그런데 큰 문제가 있습니다. 소프트웨어는 복제가 쉬어도 너무 쉽다는 것이지요.


초창기 기업들이 소스코드를 공개하지 않고 라이선스로 묶어 두거나, 접근 권한을 제어하여 탑-다운으로 관리하는 방법을 고수했습니다. 그 전개에서 치열한 소프트웨어 소유권에 대한 논쟁이 시작됩니다. 연구자와 해커들은 무료로 소스가 공개되어야 한다고 하고, 기업들은 기업 자산으로 철저히 보호되어야 한다고 맞서고 있었습니다. 지금 현재의 판세는 리눅스가 문을 연 오픈 소스의 성공이라고 보입니다.


기술 자산의 소유권이라는 정치ㆍ경제적인 접근이 아니어도 기술의 개방과 폐쇄는 늘 뜨거운 감자가 됩니다. 디지털 기술은 데이터를 다루는 것이 요체인데 데이터라는 것이 커다란 이중성을 지니고 있기 때문입니다. 어원이 되는 "주고받는 것"이 뜻 하듯, 데이터는 주고받을수록, 그 양이 많아질수록 효용가치가 늘어납니다. 반면, 유출ㆍ위조ㆍ악용ㆍ오 사용의 위험은 늘어나는 것이지요.

오픈소스의 장단점 (자료=IDC Korea)


"AI의 민주화"라는 어젠다는 이처럼 새로운 이야기는 아닙니다. 새로운 디지털 기술이 태동 발전하면서 늘 같은 질문과 비판이 따라오는 것이지요. AI의 개방과 대중화를 이야기하는 진의는 '독점된 기술 권력'의 견제일 것입니다. 가장 자본주의적인 산물인 IT 기술에 자본주의의 타성이 스며드는 것을 견제하는 것입니다. IT라는 것은 태생이 비주류의 반골들의 세상 참여이니까요.


IT 민주화의 주요 덕목은 개방ㆍ참여ㆍ공유입니다. 이 지점이 사실 아이러니합니다. 말은 "민주화"인데, 덕목의 주심엔 자본주의와 배척되는 사회주의적 철학이 깔려 있기 때문입니다. 본디 소프트웨어 라이선스는 "사유재산"을 지키는 방도입니다. 'IT 민주화'는 이를 비토하고 공유하고, 무료 사용해야 한다고 주장하고 있습니다. 아이러니입니다.


반면, 통제하고 제어해야 한다는 "폐쇄성"의 주장도 일리가 있습니다. 보안에서 가장 유출 경로가 많은 것은 '내부 유출자' 즉, 밀접한 "사람"이기 때문입니다. 거다 빅 테크들이 기술 독점을 행사하면 이들이 세상을 움켜 쥘 것이라는 민주화의 위기는 머릿속에 사는 작용합니다. 단 일상은 그 반대의 본능이 지배합니다. 바로 일상적인 두려움입니다. AI를 이용하는 주체들의 윤리와 도덕적인 완결을 누구도 장담할 수 없기에, 나의 데이터들이 악용될 가능성은 실재하기 때문입니다.



'디지털 기술' '개방' '폐쇄' 다툼의 산물


https://www.nytimes.com/2022/08/24/technology/ai-technology-progress.html?searchResultPosition=1


최근 뉴욕타임스의 테크 칼럼은 AI 시스템이 인류에게 도움이 되는 일이 무엇인지, 능력과 잠재력은 어느 정도인지, 그리고 위험과 기회를 가치중립적으로 판단하는 것이 필요하다고 주장합니다. 규제기관이나 정부에서 그런 일을 해야 한다는 것이지요. 첨단 AI 연구에서 어떤 과정과 산물이 있는지를 모니터링해야 합니다. 이와 더불어 AI 개발에 자금을 들이붓고 있는 빅 테크들이 스스로 무엇을 하고 있는지 좀 더 잘 설명할 책임의식을 가져야 한다는 것입니다.


이를 위해서는 언론과 시민사회의 노력도 필요합니다. 언론 미디어나 관련 기관들은 비전문가가 대부분인 독자들에게 AI의 발전과 효과에 대해 자세하고 효과적인 설명이 필요합니다. 머신러닝 이야기하면서 "로봇"을 운운하고 사진을 쓰거나, AI를 설명하는 기사나 자료에 스타워즈의 3PO나 센테니얼맨의 사진을 쓰면서, "로봇의 역습"같은 카피를 다는 일을 지양했으면 합니다. 세발자전거를 이야기하면서, 미래형 콘셉트카의 사진을 걸어둔 격이 됩니다. 언론의 깊은 이해 없는 부풀리기는 과도한 불안이나 반대로 기대를 품게 하기 때문에, 인식 오류의 기반이 됩니다.

"사업가"와 "사기꾼", 정보 기술의 양면성 (사진=디센터)

컴퓨팅 기술은 마치 변증법식 진화를 지속했다고 생각합니다. 무엇이 '정'이고 무엇이 '반'인지 아직 판단 보류이지만, 중앙에 모아 놓는 중앙화와 주변으로 분산하는 탈중앙화의 정반합, 소스의 무료 개방과 위기관리를 위한 폐쇄의 정반합, 그리고 기술 권력과 기술 이익의 소수 독점의 시대와 모든 사용자와 구성원들에게 분배라는 정반합의 역사가 지금도 진행 중입니다.


지금 뜨거워진 'AI 민주화'도 그런 정반합의 사슬 안에 있다고 생각합니다. 이를 안정화하기 위해서는 기업, 연구자, 정부, 언론, 사용자들의 노력이 어느 때보다 필요합니다. 그러나, 한국의 생태계는 답답한 모습이 있습니다. 우선 AI로 자리 잡은 테크 기업이 눈에 띄지 않습니다. 그리고 정부는 뚱딴지 같은 코딩 타령입니다. 언론의 보도나 기사는 둘 중 하나입니다. 완전히 이해하지 못했거나, 잘난 맛에 너무 어렵거나 말이지요. 각자의 위치에서 "진짜"를 고민하는 계기가 되기를 바랍니다.
















keyword
매거진의 이전글[문과지만 기술합니다] #1 블록체인(1)