발전된 세계에서 우리가 자주 마주하게 될 아이러니
요즈음 생성형 AI를 이용해 Text to Image 또는 Text to Video를 만드는 재미에 빠져, 다양한 이미지와 동영상을 만들어 보고 있다.
Midjourney나 Blue Willow, Stable Diffusion의 dream studio나 Clipdrop, Canva, AskUp, Pokeit 등 여러 프로그램으로 내가 필요로 하거나 상상하는 이미지를 Text로 넣으면 이미지로 생성해 준다.
Pixlr 등 이미지 편집 전문 Tool에서조차 Text로 이미지를 생성해 주기도 한다.
Hugging face는 내 사진을 이용해 실사나 일러스트 형태의 본인과 유사한 캐릭터(JB)를 만들 수 있다.
D-ID에서는 말하는 ‘JB’로 동영상을 만들 수도 있고, Vrew, Canva 등에서는 일반 유튜브 동영상이나 쇼츠 동영상도 만들 수 있다. 네이버의 크로바 보이스에서 목소리를 선택한 후, 하고 싶은 말이나 대사를 Text로 입력해 음성파일을 생성형으로 만든다. 또 크로바 보이스나 online-voice-recorder에서는 내 음성으로 녹음하여 음성파일도 만들 수 있다.
이 음성파일들을 활용해 D-ID나 Vrew에서 내레이션과 자막을 넣어 강의 혹은 회사나 상품소개 등 다양한 용도의 동영상을 만들 수 있다. AIVA나 SOUNDRAW에서 배경음악도 생성하여 넣을 수 있다.
수년 전까지만 해도 전문지식이 없으면 상상할 수 없는 일들이 일어나고 있다.
편리하고 간편한 세상이 된 것이다.
그러면서 한편으로는 리얼과 가상, 리얼과 언리얼에 대한 생각도 해보게 된다.
최근 셀카 보정 앱인 '스노우'에 대한 인기와 유명 연예인의 사용 사례가 기사화되었다. 자신의 셀카 사진을 원하는 필터를 통해 리얼과 같은 언리얼 이미지로 바꾸어 주는 것이다.
과거의 뽀샵이나 보정의 수준을 넘어서 성형(?)을 해 주는 수준이 된 것이다.
10대나 20대들에게서 셀카 증명사진을 앱을 통해 자신이 원하는 모습으로 보정하는 것이 유행이다.
SNS에서는 문제없지만, 증명사진으로 사용하면 식별하기 어려워 이력서는 물론이고 주민등록증에도 사용하여 통과되기도 한다는 것이다. 그도 그럴 것이 가상인간 같은 형태는 바로 눈에 띄지만, 실사의 경우는 느낌은 달라지지만 본인의 특징은 그대로 유지하고 있어 구별이 어렵기 때문이다.
얼마 전까지만 해도 리얼(Real-현실세계)과 가상(Virtual- 가상세계)을 넘나들면서도 경계를 확실히 구별할 수 있었다. 그런데 지금은 AI 기술이 발전하면서 언리얼(Unreal-상상의 비현실세계)이 리얼과 구별이 어려워질 정도이다. 현실과 가상의 사이에 언리얼이 들어와, 비현실적인 상황을 현실처럼 경험하게 되면서 개인적으로는 재미도 있고, 사업 측면에서는 용도가 확대되어 확실히 긍정적이다.
하지만 지금도 ChatGPT에서 경험하고 있는 환각(Hallucination)을 넘어서, 보다 더 사실적으로 보이게 하는 Fake를 양산할 수 있는 큰 문제와 마주해야 한다. 수년 전에 오바마대통령 얼굴과 목소리로 거짓 연설을 하게 하는 Deep fake가 화제가 된 적이 있었다. 그래도 그것은 경험적 지식과 조금만 수고를 거치면 바로 진실이 규명될 수 있었다. 최근 미 국방부 펜타곤 대형 폭발 AI 사진도 마찬가지이다.
과거에는 사진 1장만 가지고 그 사람의 인상이나 특징, 심지어 성격까지도 추정할 수 있는 시대에서, 이제는 Real을 현실세계에서 보면서 구별해 내고, 검증해 내야 하는 수고와 번거로움이 점점 더 커지고 있다. 아직은 발전이라는 성과물이 불편함을 감수할 수 있을 정도이기는 하지만, 편리해지고 발전된 세계에서 우리가 자주 마주하게 될 아이러니컬하게 느껴지는 장면들이다.
리얼과 가상, 그리고 그 사이의 언리얼 사이를 오가고 있는 것이다.