생성 모델은 AI가 데이터를 학습해 새로운 데이터를 생성하는 기술을 의미한다. 이 기술의 중심에는 두 가지 주요 아키텍처가 있다. 생성적 적대 신경망(GAN)과 변분 오토인코더(VAE)다.
생성적 적대 신경망(GAN)은 두 개의 신경망, 즉 생성자와 판별자가 서로 경쟁하는 구조를 취한다. 이름에서도 알 수 있다시피 generator와 discriminator 모델에 관해 ‘adversarial’ network를 구성하여 두 모델을 서로 번갈아 학습하여 최종적으로는 학습된 generator를 사지고 생성 모델로 사용하는 것이다. 생성자는 판별자를 속이기 위해 가짜 데이터를 생성하고, 판별자는 이 데이터가 가짜인지 아닌지를 잘 판단할 수 있도록 학습한다. 이러한 상호작용을 통해 생성자는 더욱 실제와 유사한 데이터를 만들어 내게 되는 것이다. 최근에 이슈가 되었던 딥페이크 영상 제작도 GAN의 대표적인 응용 사례라고 할 수 있다.
변분 오토인코더(VAE)는 입력 데이터를 저차원 잠재 공간으로 압축한 후 이를 다시 원래 공간으로 복원하는 과정을 거친다. VAE는 데이터를 압축하고 복원하는 과정에서 새로운 데이터를 생성할 수 있는 특징을 가지고 있다. 이 방식은 주로 얼굴 이미지 생성, 이미지 변형, 데이터 복원 등에 사용된다.
GAE와 VAE는 모두 데이터 생성에 사용되지만, 그 접근 방식에 차이가 있다. GAN은 생성된 데이터의 사실성을 높이는 데 중점을 두며, 특히 고해상도 이미지와 비디오 생성에 적합하다. 반면, VAE는 데이터의 구조와 분포를 학습하고 이를 바탕으로 새로운 데이터를 생성하는 데 강점이 있으며, 데이터의 잠재 공간을 학습하는 데 유리하다.
딥페이크(Deepfake)는 인공지능의 기술을 이용해 사람의 얼굴이나 목소리를 다른 사람의 것으로 대체하는 기술이다. 딥페이크는 ‘딥 러닝(Deep Learning)’과 ‘가짜(fake)’의 합성어로, 주로 딥 러닝의 한 분야인 생성적 적대 신경망(GAN)과 장단기 메모리(LSTM)을 이용하여 생성된다.
딥페이크에 사용되는 기술을 GAN, LSTM, 트랜스포머 및 오토인코더 측면에서 살펴보면 다음과 같다.
딥페이크 기술은 엔터테인먼트, 광고, 교육, 의료 등 다양한 분야에서 혁신적인 변화를 가져오고 있다.
- 엔터테인먼트 분야
영화, 게임, 광고 등에서 딥페이크를 활용해 더욱 현실감 있는 특수 효과와 캐릭터를 만들 수 있다. 예를 들어, 배우의 얼굴을 다른 배우에게 합성하거나, 과거의 유명 인물을 복원하는 데 사용된다. 영화 ‘스타워즈’에서는 고인이 된 배우 캐리 피셔의 젊은 시절 모습을 딥페이크로 재현하여 자연스러운 연기를 만들어냈다. 또한 ‘아이리시맨’에서는 배우 로버트 드니로의 젊은 시절 모습을 구현하여 플롯의 일관성을 유지했다.
그리고 한국 드라마 ‘사이코지만 괜찮아’에서는 배우 김수현의 과거 모습을 딥페이크로 재현하여 이야기의 플롯을 더욱 생동감 있게 전달했다.
- 의료 분야
딥페이크 기술은 의료 교육에서 복잡한 수술을 시뮬레이션 하거나, 환자의 상태를 시각화하는 데 사용될 수 있다. 이는 의료 전문가들에게 중요한 훈련 도구가 된다. 예를 들어, 의사가 수술 계획을 세울 때 환자의 3D 모델을 통해 예행연습을 할 수 있다. 예를 들어, 2019년 7월 독일 뤼벡대학교 의료 정보학 연구소에서는 딥페이크 기술을 이용하여 다양한 암의 징후와 이상 시노를 탐지 가능한 모델을 개발했다.
딥페이크와 생성 모델 기술은 AI의 놀라운 가능성을 보여주는 동시에, 이를 둘러싼 윤리적, 사회적 논의가 필수적임을 상기시켜준다. 이 기술들은 긍정적으로는 창의성과 효율성을 극대화하며 예술, 교육, 의료 등 다양한 분야에서 새로운 기회를 창출할 수 있다. 반면, 허위 정보 확산, 프라이버시 침해 등의 문제는 기술이 발전함에 따라 더욱 복잡하고 심각해지고 있음이 분명하다.
따라서 우리는 딥페이크와 생성 모델이 가져올 미래를 잘 준비하고, 그 발전 속도를 따라갈 규제와 윤리적 프레임워크를 구축해야 할 필요가 있다. 기술이 제공하는 혜택을 극대화하면서도, 그로 인해 발생할 수 있는 부작용을 최소화하기 위해서는 지속적인 연구와 사회적 논의가 함께 이루어져야 한다. AI 기술이 창출하는 새로운 가능성의 문턱에서, 우리는 이 기술을 어떻게 이해하고, 책임 있게 사용할 것인가?
작성자: ITS 26기 강세아