brunch

You can make anything
by writing

C.S.Lewis

by CMDJAI Nov 16. 2019

유사품과 인공지능

딥 페이크(deepfake)와 컴퓨터 비전 (computer vision

     세상의 모든 것이 데이터가 될 수 있는 시대가 왔고, 우리가 찍는 사진과 영상도 예외는 아니다. 더 선명하고 보기 좋은 한 장의 사진을 얻기 위해 우리는 여러 차례 촬영을 하거나 보정 소프트웨어를 이용한다. 모든 그림 영상은 픽셀이라고 불리는 점들로 구성되어 있는데, 재촬영을 하거나 보정 소프트웨어를 사용하는 것은 사진의 픽셀에 영향을 주어서 화질을 향상하는 것이다. 이런 보정 과정을 거치면서 사람의 시각 범위 안에 들어온 그림 영상은 더 선명하게 보이기도 하고, 아예 다른 형태의 그림으로 인식되기도 한다. 이러한 그림 영상을 이루는 무수히 많은 점들의 집합인 픽셀도 빅데이터 시대의 중요한 데이터가 될 수 있다. 비슷한 예를 하나 들어보자면, 운동 경기장에서 응원할 때, 관중석을 가득 메운 사람들이 각자 다른 색의 옷이나, 수건, 깃발 등을 장비하고 카메라가 멀리서 관중석을 찍었을 때, 거대한 태극기처럼 보이는 것도 어떻게 보면 인간 픽셀의 이미지화라고 할 수 있다.   

     이러한 픽셀의 빅데이터화는 다양한 형태로 분석되고 편집되면서, SNS 나 블로그에 올라가는 사진과 영상의 화질을 좋게 만들거나 특수효과를 더하는데 많은 도움이 되었다. 사진과 영상 속에 있는 인물이나 사물을 픽셀 단위로 세세하게 분석한 후 더 좋게 보이게 만들기 위해 더하고, 빼고, 변형하는 과정은 나날이 발전했다.

     대학원에서 수학과를 지나가다 보면, 여러 가지 연구물들을 포스터의 형태로 걸어 놓는데, 대부분의 내용들은 어떠한 수식을 해석학의 어떤 방식으로 증명을 했거나, 그룹에 속한 무한한 원소들을 배열하는 어떤 이론을 완성했거나, 수 이론에 어떤 법칙의 연장선에 있는 증명을 보완했다는 등의 이론에 상당히 치중된 것들이었다. 수학 전공이었던 나에게는 수업시간에 배웠던 어떤 이론의 일부가 각 분야의 수학자들을 거치면서 다른 형태로 확장되는 것이 신기하면서도 흥미로웠다. 그러나, 내가 만약 역사 전공을 하는 친구를 이 건물에 데리고 왔다면, 포스터를 보면서 서성거릴 시간도 없이 빠르게 지나쳤을 그런 장소였다. 여느 날과 마찬가지로 수학과 앞을 지나는데, 새로운 포스터가 눈에 확 들어왔다. 먼발치에서 본 수식이 아름다워 보여서는 아니었다. 포스터 안에 지금까지 걸려 있던 다른 수학과의 포스터들과 상당히 이질적인 거대한 그림이 들어 있었다. 한눈에 봐도, 프랑스의 한 예술박물관에서 볼 법한 작품이었다. 중세 시대의 귀족, 천사, 그리고 신이 들어 있는 그림을 지닌 포스터의 정체가 무엇인지, 어떻게 수학과 포스터들 사이에 끼게 되었는지가 궁금할 따름이었다. 

     그림을 자세히 보니, 신으로 보이는 자의 얼굴 주변에 카메라 초점을 맞춘 듯한 초점선이 보였다. 순간 머릿속에 스쳐간 생각은, 얼굴 인식 프로그램의 개발이 그림의 얼굴도 인식하는 것을 보여주려는 것인가 싶었는데, 자세히 보니 천사처럼 보이는 자들의 팔 근처에도 초점선이 보였다. 한참 동안 그림에서 특이한 점이 없나 찬찬히 살펴보다 보니, 이 초점선들은 얼굴과 팔의 인식보다는 그 재질을 집중적으로 보여주려는 것처럼 보였다. 그림 감상을 마치고 나서 포스터의 글을 읽기 시작했다. 이 연구의 내용은 그림의 해상도를 변형시키면서 그림의 미세한 재질을 파악해서 이 그림이 진품인지를 판별하는 것이었다. 인공지능의 발전이 여러 명의 예술작품 판별사들의 생계까지 위협하는 중이라는 생각이 들었다. 이 연구를 처음 본 것이 2015년 즈음이었다.        

     인공지능이 사진과 영상의 보정뿐만 아니라, 재질과 성분의 분석을 통한 판별을 하는 것에도 도움을 준다는 것은 분명한 순기능이었다. 사람의 눈보다 정밀한 깊이로 더 빠르게 진짜와 가짜를 구분해 준다면 그로 인해 얻는 이익은 어마어마할 것이니까. 이 순기능은 인공지능을 어떤 사진이나 영상의 픽셀을 분석하고 판별하기 위해 사용했을 때 가능한 것이다. 보안 시스템을 보호하는 것과 해킹하는 것이 같은 원리를 이용하지만 방향만 다른 것이다. 한쪽은 시스템의 문을 아무나 열 수 없게 복잡한 내부구조의 열쇠 구멍을 만드는 사람이고, 다른 쪽은 그 열쇠 구멍에 딱 맞는 열쇠를 만드는 사람인 것이다. 인공지능을 원본과 복사본의 구분에 사용하는 대신에, 원본의 성질을 그대로 재현해서 실제 같은 복사본을 만든다면 어떻게 될지 생각만 해도 골치 아픈 일이다. 2019년 현재, 유튜브나 다양한 매체를 통해 진짜들 틈에 섞여서 그들을 흉내 내는 진짜 같은 복사본들이 아무도 모르게 돌아다니고 있다. 

     가장 큰 문제점은 누군가 악의적인 목적을 가지고 특정 유명인의 얼굴과 행동을 흉내 내는 영상 속 어떤 모조품에게 사실이 아닌 내용을 떠들게 한다면, 우리는 어떻게 그러한 문제점을 막을 수 있을지는 심각하게 생각하고 대처해야 할 문제일 것이다. SNS나 블로그를 통해 포스트 속 내용들이 빠르게 유포되는 현실에서, 이미 위조된 영상이 퍼지고 나서 뒤늦게 판별하는 것은 어마어마한 피해를 일으킨 후일 수도 있다. 영상이 어떤 SNS나 블로그를 통해 올려지는 순간 사진이나 영상에 위조 가능성을 표시할 수 있는 프로그램이 개발된다면 위조 영상에 의한 피해를 미연에 방지할 수 있을 것이다.

      순기능과 역기능이 심하게 부딪히고 있는 인공지능을 이용한 그림 영상 분석이지만, 우리가 그림이나 영상에 대한 기본적인 지식을 가지고, 데이터로 어떻게 전환되며, 어떤 방식으로 영상이 보정되거나 위조될 수 있는지 살필 수 있다면, 거짓 영상에 의한 피해를 전반적으로 줄일 수 있을 것이다. 사진은 픽셀로 구성되어 있고, RGB (빨강, 초록, 파랑을 나타내는) 색을 기반으로 모든 색을 표현할 수 있다. 프로그램들이 사진을 원본 데이터의 형태로 읽을 때, 픽셀과 각 픽셀의 색 종류가 기록되고, 그 후부터 다양한 분석이 시작된다. 컴퓨터과학에서 사용하는 사진 분석의 용어들은 우리가 스마트폰 애플리케이션에서 사용하는 용어들과 비슷한 것들이 많다. 필터링이나 매칭 등을 통해 사진의 여러 가지 성질을 살펴보고 변환시키는데, 프로그래밍 언어를 이용하거나 스마트폰을 이용해서 사진 편집을 하는 것이 유사하다는 것을 느낄 수 있다. 인공지능 덕분에 우리의 말, 글, 사진과 영상 등이 모두 정보 데이터로 기록되는 시간이 왔고, 그 정보 데이터의 가치와 중요성을 지키면서, 동시에 일어날 수 있는 문제점들에 대해서 미리 인식하고 관련 기본지식을 보유하고 있는 것도 도움이 될 것이다.   

이전 15화 역사와 데이터 과학 
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari