시작은 페이스북의 한 포스팅이었다.
TED: https://www.youtube.com/watch?v=ojttMNOW6zM
인구의 10%에서 30%는 머릿속에서 이미지를 "볼" 수 없다. Aphantasia라고 불리는 이 현상은 장애가 아니다. 단지 인간 의식 경험의 스펙트럼일 뿐이다. "빨간 사과를 떠올려보세요"라는 말에 어떤 이들은 머릿속에서 실제로 사과가 보인다. 어떤 이들은 "빨간색, 둥근 형태, 광택"이라는 개념만 떠올린다.
흥미로운 것은 이 차이를 아무도 몰랐다는 점이다. 정신적 시각화를 할 수 없는 사람들은 "시각화하다"라는 단어가 비유인 줄 알았다. Blake Ross는 이렇게 말했다. "사람들이 '양을 세면서 잠든다'고 할 때, 나는 그게 비유인 줄 알았다. 너희들 진짜로 양이 보인다고?"
그런데 AI 이미지 생성 기술이 등장하면서 상황이 역전되었다. 정신적 시각화를 할 수 없던 사람들이 처음으로 자신의 개념을 "볼" 수 있게 되었다. 프롬프트를 입력하면 화면에 이미지가 나타난다. 내부가 아닌 외부에, 주관적이 아닌 객관적으로.
이것은 흥미로운 출발점이지만 핵심은 아니다. 핵심은 AI가 인간의 시각화를 근본적으로 다른 무언가로 전환하고 있다는 것이다. 이것은 보완도 아니고 대체도 아니다. 새로운 종류의 창작이다.
우리는 지금까지 잘못된 전제에서 출발했다. "AI가 시각화한다"는 말 자체가 오해다.
AI는 본 적이 없다. 눈이 없고 시각 피질이 없다. 빨간 사과를 경험한 적이 없으며 사과의 "빨강"이 무엇인지 모른다. 그런데 "빨간 사과"라고 프롬프트를 입력하면 빨간 사과 이미지가 나온다.
AI는 시각화하지 않는다. 번역한다. 수억 장의 이미지와 그에 붙은 텍스트 라벨의 상관관계를 학습했다. "빨간", "사과"라는 단어 조합이 나타날 때 함께 등장하는 픽셀 패턴의 통계적 분포를 추출한다. 그 분포에서 샘플링하여 새로운 픽셀 배열을 만든다.
이것은 시각화가 아니라 통계적 재구성이다.
인간이 "빨간 사과"를 떠올릴 때와 근본적으로 다르다. 인간은 과거에 본 사과들, 먹었던 사과의 맛, 사과를 깎던 기억, 사과가 등장하는 동화 등 수많은 경험의 총체에서 이미지를 구성한다. 그 이미지는 개인적이고 맥락적이며 감정적이다.
AI의 이미지는 개인적이지 않다. 수억 명이 업로드한 사과 사진들의 평균이다. 맥락이 없다. 단지 "빨간"과 "사과"라는 단어에 통계적으로 연결된 픽셀 패턴이다.
그런데 놀라운 일이 벌어진다. 이 "평균"이 작동한다.
지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.
오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠