brunch

You can make anything
by writing

C.S.Lewis

생성 모델과 딥페이크 기술


1-1. 기술의 발전과 생성 모델의 기본원리


생성 모델은 AI가 데이터를 학습해 새로운 데이터를 생성하는 기술을 의미한다. 이 기술의 중심에는 두 가지 주요 아키텍처가 있다. 생성적 적대 신경망(GAN)과 변분 오토인코더(VAE)다.

생성적 적대 신경망(GAN)은 두 개의 신경망, 즉 생성자와 판별자가 서로 경쟁하는 구조를 취한다. 이름에서도 알 수 있다시피 generator와 discriminator 모델에 관해 ‘adversarial’ network를 구성하여 두 모델을 서로 번갈아 학습하여 최종적으로는 학습된 generator를 사지고 생성 모델로 사용하는 것이다. 생성자는 판별자를 속이기 위해 가짜 데이터를 생성하고, 판별자는 이 데이터가 가짜인지 아닌지를 잘 판단할 수 있도록 학습한다. 이러한 상호작용을 통해 생성자는 더욱 실제와 유사한 데이터를 만들어 내게 되는 것이다. 최근에 이슈가 되었던 딥페이크 영상 제작도 GAN의 대표적인 응용 사례라고 할 수 있다. 

변분 오토인코더(VAE)는 입력 데이터를 저차원 잠재 공간으로 압축한 후 이를 다시 원래 공간으로 복원하는 과정을 거친다. VAE는 데이터를 압축하고 복원하는 과정에서 새로운 데이터를 생성할 수 있는 특징을 가지고 있다. 이 방식은 주로 얼굴 이미지 생성, 이미지 변형, 데이터 복원 등에 사용된다. 

GAE와 VAE는 모두 데이터 생성에 사용되지만, 그 접근 방식에 차이가 있다. GAN은 생성된 데이터의 사실성을 높이는 데 중점을 두며, 특히 고해상도 이미지와 비디오 생성에 적합하다. 반면, VAE는 데이터의 구조와 분포를 학습하고 이를 바탕으로 새로운 데이터를 생성하는 데 강점이 있으며, 데이터의 잠재 공간을 학습하는 데 유리하다.


1-2. 딥페이크와 생성 기술


딥페이크(Deepfake)는 인공지능의 기술을 이용해 사람의 얼굴이나 목소리를 다른 사람의 것으로 대체하는 기술이다. 딥페이크는 ‘딥 러닝(Deep Learning)’과 ‘가짜(fake)’의 합성어로, 주로 딥 러닝의 한 분야인 생성적 적대 신경망(GAN)과 장단기 메모리(LSTM)을 이용하여 생성된다. 


딥페이크(Deepfake) 기술(GAN+LSTM)의 생성 원리 개념도


딥페이크에 사용되는 기술을 GAN, LSTM, 트랜스포머 및 오토인코더 측면에서 살펴보면 다음과 같다.  

                 




1-3. 딥페이크의 활용 분야 및 사례


딥페이크 기술은 엔터테인먼트, 광고, 교육, 의료 등 다양한 분야에서 혁신적인 변화를 가져오고 있다. 


- 엔터테인먼트 분야

영화, 게임, 광고 등에서 딥페이크를 활용해 더욱 현실감 있는 특수 효과와 캐릭터를 만들 수 있다. 예를 들어, 배우의 얼굴을 다른 배우에게 합성하거나, 과거의 유명 인물을 복원하는 데 사용된다. 영화 ‘스타워즈’에서는 고인이 된 배우 캐리 피셔의 젊은 시절 모습을 딥페이크로 재현하여 자연스러운 연기를 만들어냈다. 또한 ‘아이리시맨’에서는 배우 로버트 드니로의 젊은 시절 모습을 구현하여 플롯의 일관성을 유지했다.


영화 <아이리시맨>에서 배우 로버트 드니로를 딥페이크 기술로 구현


그리고 한국 드라마 ‘사이코지만 괜찮아’에서는 배우 김수현의 과거 모습을 딥페이크로 재현하여 이야기의 플롯을 더욱 생동감 있게 전달했다. 


-  의료 분야

딥페이크 기술은 의료 교육에서 복잡한 수술을 시뮬레이션 하거나, 환자의 상태를 시각화하는 데 사용될 수 있다. 이는 의료 전문가들에게 중요한 훈련 도구가 된다. 예를 들어, 의사가 수술 계획을 세울 때 환자의 3D 모델을 통해 예행연습을 할 수 있다. 예를 들어, 2019년 7월 독일 뤼벡대학교 의료 정보학 연구소에서는 딥페이크 기술을 이용하여 다양한 암의 징후와 이상 시노를 탐지 가능한 모델을 개발했다. 


딥페이크 기술 적용 의료 영상



1-4. 마무리


딥페이크와 생성 모델 기술은 AI의 놀라운 가능성을 보여주는 동시에, 이를 둘러싼 윤리적, 사회적 논의가 필수적임을 상기시켜준다. 이 기술들은 긍정적으로는 창의성과 효율성을 극대화하며 예술, 교육, 의료 등 다양한 분야에서 새로운 기회를 창출할 수 있다. 반면, 허위 정보 확산, 프라이버시 침해 등의 문제는 기술이 발전함에 따라 더욱 복잡하고 심각해지고 있음이 분명하다.

따라서 우리는 딥페이크와 생성 모델이 가져올 미래를 잘 준비하고, 그 발전 속도를 따라갈 규제와 윤리적 프레임워크를 구축해야 할 필요가 있다. 기술이 제공하는 혜택을 극대화하면서도, 그로 인해 발생할 수 있는 부작용을 최소화하기 위해서는 지속적인 연구와 사회적 논의가 함께 이루어져야 한다. AI 기술이 창출하는 새로운 가능성의 문턱에서, 우리는 이 기술을 어떻게 이해하고, 책임 있게 사용할 것인가?


작성자: ITS 26기 강세아


작가의 이전글 금융은 블록체인을 어떻게 활용하는가
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari