brunch

You can make anything
by writing

C.S.Lewis

by OOJOO Nov 21. 2024

AI로 인한 사회적 고민, 딥페이크

세상을 혼란하게 하는 생성형 AI

2023년 ChatGPT는 너무나 자연스럽고 전문가 뺨치는 글솜씨와 번역, 요약, 코딩 실력에 세상을 깜짝 놀라게했다. 글만 봐서는 사람이 쓴건지, AI가 생성한 것인지 알아챌 수가 없었다. 그렇다보니 소설가, 시인, 구성작가, 칼럼니스트 등의 글쓰는 사람들은 일자리가 사라질까 두려움에 떨고, 보도자료 작성이나 보고서 작성, 홍보 문구 작성하는 사무직 직장인들도 AI에 일자리가 대체되는지 걱정하기에 이르렀다. 실제로 소프트웨어 개발자와 데이터 분석가 등의 일자리는 실제 위협받고 있다. 그런 AI가 2024년 접어들면서는 그림을 그리고 진짜같은 사진을 만드는데다, 동영상과 음성까지도 생성해내면서 사회의 공포는 극에 달하고 있다. 사진을 생성해주는 미드저니나 달리3도 갈수록 화질이 좋아지고 실제 사진만큼 진짜같다. 무엇보다 달리는 ChatGPT에 통합되어 제공됨으로써 사용성이나 접근성이 뛰어나다. 별도의 사용법을 익히지 않고도 누구나 텍스트 명령만으로 상상하는 것을 그림으로 만들 수 있다. 전문적인 프롬프트없이도 생각나는대로 원하는 이미지를 읊으면 사진으로 생성되는 것이다.

게다가 ChatGPT에서 지난 2월에 발표한 Sora라는 동영상 생성 서비스는 너무도 사실적인 영상을 만들어주어 세상은 놀라는 것을 넘어 진짜와 가짜를 구분할 수 없을만큼 뛰어난 성능의 AI로 두려움을 느꼈다. 또한, 알리바바는 EMO(Emote Portrait Alive)라는 AI는 사진만으로 말하는 동영상을 만들어주는 생성형 AI를 발표했다. EMO는 Audio to Video 기반의 생성형 AI로 사진과 음성 파일을 입력하면 오디오 파일 내 음성에 맞춰 사진 속 인물의 입 모양과 얼굴 표정을 조정해 동영상으로 만들어준다. 입력된 음성의 내용에 맞게 표정의 미묘한 변화를 포착해서 자연스러운 결과물을 생성한다는 것이 특징이다. 이후에도 구글은 루미에르, 런웨이의 젠-2, 메타의 에뮤비디오가 출시해 특정 영역에 최적화된 영상 생성 서비스로서 자리매김해가고 있다. 시간이 흐를수록 이들 서비스의 완성도는 더욱 좋아질 것이며 다양한 영역에서의 활용 사례가 늘어갈 것이다.

알리바바의 EMO

국내에도 KT의 AI 보이스 스튜디오를 이용하면 특정인의 목소리오 똑 닮은 보이스를 제작할 수 있다. 물론 다양한 나라의 언어로도 음성합성이 가능하다. 내 목소리는 물론 다른 사람의 음성을 샘플로 넣으면 그 목소리와 닮은 목소리로의 합성이 가능한 셈이다. 스크립트를 아나운서의 또렷한 발음으로 생성할 수 있다. 물론 실제 아나운서가 그 스크립트를 읽고 녹음하는 수고없이도 AI로 그 즉시 스크립트를 아나운서의 목소리로 생성할 수 있는 것이다. 실제 헤이젠이라는 스타트업의 영상 편집기는 내 얼굴 영상과 스크립트만으로도 실제 내가 녹화한 것같은 영상을 제작할 수 있도록 해준다.

KT의 AI 보이스 스튜디오

그런데, 사실 수 년전부터 이러한 기술은 이미 존재했다. 다만, 아무나 사용할 수 없었을 뿐이다. 사용하기에는 비용도 비싸고, 오랜 시간이 걸리며, 해당 기술을 제공하는 솔루션 기업을 찾아 여러번의 협의를 해가면서 작업을 해야 하는 일이었다. 하지만, 이제는 달라졌다. 이런 기술들은 전 세계 누구나 사용 가능하다. 아무나 쉽게 사용해 진짜같은 사진과 영상들을 단숨에 만들수 있게 되었다. 그로 인해 만들어지게 될 수 많은 가짜 영상들이(딥페이크) 우리 사회를 혼란스럽게 할 수 있다. 아니 실제로 그런 일들이 우리 현실에서 벌어지고 있다. 2024년 1월 홍콩에서 딥페이크 화상회의를 통해 임원들을 사칭해 15차례에 걸쳐 340억원을 갈취한 사건이나 나이지리아, 싱가포르, 슬로바키아 등에서 정치인을 사칭한 딥페이크 영상과 오디오 등이 유포되어 선거나 금융 사기 등에 악용되기도 했다. 한국의 가수, 배우 등의 연예인과 일반 여성도 딥페이크 성착취물에 이용되어 명예가 훼손되고 디지털 성범죄에 악용되기도 했다.

미드저니의 한차원 개선된 6.1V

AI 기술이 무분별하게 확산되고 현실과의 경계가 모호해지면서, 사회는 새로운 도전에 직면하고 있다. 생성형 AI는 단순히 창의적 도구로서의 기능을 넘어, 그 강력한 생산력으로 인해 현실의 틀을 뒤흔드는 존재가 되었다. AI가 생성한 영상, 음성, 이미지가 실제와 구분되지 않을 정도로 정교해지면서, 그 활용도와 접근성이 급격히 높아졌고, 이는 곧바로 사회적 리스크로 이어지고 있다. 누구나 손쉽게 고화질의 가짜 사진과 영상을 생성할 수 있는 지금, 잘못된 정보와 신뢰를 깨뜨리는 콘텐츠가 손쉽게 대중에게 노출될 수 있는 환경이 마련된 셈이다.

더욱이 AI 기술이 초래하는 문제는 그저 개인적 불이익에 머물지 않는다. 범죄 집단이나 악의적인 세력들은 이를 통해 신원 도용, 사기, 정치적 조작 등을 계획하며, 실제로 피해 사례가 급증하고 있다. 딥페이크 화상회의로 수백억 원을 사취하는 사건이나 정치인과 유명인을 사칭한 가짜 콘텐츠가 사회에 혼란을 일으키는 일들은 이제 더 이상 상상 속의 이야기가 아니다. 개인의 명예를 훼손하고 사회적 불신을 조장하는 등, AI가 인간 사회에 미칠 수 있는 악영향의 파급력은 우리가 감당하기에 너무 크고 무거워졌다.

생성형 AI는 더 이상 기술적 호기심의 대상이 아니다. 오히려 그 강력한 영향력을 자제하고, 악용을 방지하기 위한 철저한 규제와 사회적 안전망이 시급히 마련되어야 한다. 마치 무기처럼 그 사용이 엄격히 통제되어야 하는 기술로서 다루어져야 한다. 기술의 특이점이 눈앞에 다가온 지금, 사회는 AI를 안전하게 관리하고 통제하는 시스템을 마련하지 않으면, 이 무분별한 기술은 폭주하는 망아지가 되어 사회 곳곳에 혼란을 초래할 것이 분명하다. 기술의 발전이 진정한 혁신이 되기 위해서는, 이를 안전하게 사용할 수 있는 강력한 윤리적, 법적 안전장치가 필수적이다. AI를 선용하는 것이 사회적 책임으로 자리 잡아야만 한다.

✍ 2025년 IT/AI 전망과 기업/개인의 대처 방안에 대해 쓴 저자의 책

➡ https://www.yes24.com/Product/Goods/133327806

IT 트렌드 2025 - 예스24

“AI의 작동 원리를 이해하고, 스킬까지 갖춘다면 2025년의 IT 흐름을 완벽히 이해한 것” 새로운 성장 가도를 달리는 AI의 기술과 산업을 본격 해부한다 *** 『트렌드 코리아』 김난도 교수, 한빛

www.yes24.com

❍ 2025 IT/AI 트렌드 유료 강연

➡ https://www.youtube.com/playlist?list=PL7d4-rFjtYdLF66hIIptTnNOaJpy0PtrR

keyword