3단계 — AI 인페인팅과 아웃페인팅

숫자로 그리는 세계

by 근배

오늘은 AI로 이미지와 영상을 다룬다면 반드시 알아야 하는 두 가지 핵심 기술이 있다. 바로 인페인팅(inpainting)아웃페인팅(outpainting)이다.

이 기능은 미드저니, 포토샵, 스테이블 디퓨전, GPT의 달E 등에서 대표적으로 사용 가능하다. 앞으로 AI를 다루다 보면 이곳저곳에서 계속 듣게 될 것이다.

이번 챕터에서는 이 두 기술을 포토샵을 통해 설명하려 한다. 그리고 포토샵을 사용해본 적 없는 초보자를 위해, 색과 이미지가 어떻게 '숫자'로 표현되는지 기술적인 원리도 간단히 짚고 갈 것이다. 이 직관을 얻으면, 앞으로 어떤 AI 툴이 나오더라도 두려울 게 없다.

마지막에는 실제 AI 영화 제작에서 사용된 사례를 토대로 이야기하겠다.




1. 인간이 보는 색의 세계 — 먼셀 색상환


위 예시 이미지는 먼셀 20색상환이다. 이름은 몰라도 이 동그라미를 본 적이 있을 것이다.

20세기 초 먼셀(Munsell)이라는 화가가 교육용으로 고안한 이 색 체계는 색상(H), 명도(V), 채도(C)를 20가지 색으로 분류했다. 해당 색은 인간이 느끼는 직감을 기준으로 체계적으로 정리되어 있다.

특히 이 색상환은 디자이너나 인테리어 업계에서 자주 사용하는데, 인접색, 보색, 삼색 관계 등 다양하게 이 동그라미가 활용된다.

우리 인간은 색을 직감적으로 본다. '빨강은 따뜻하고, 파랑은 차갑다'고 느낀다.

하지만 AI에게 색은 감정이 아니라 숫자다.

이 색상환을 짚고 가는 이유는 그곳에 있다. AI와 인간의 차이점을 설명하기 위해서다.




2. AI가 보는 색의 세계 — 숫자


AI 이미지 생성 모델(디퓨전 모델)은 결국 숫자 데이터를 학습한다. 포토샵도 마찬가지다. PC로 색 체계를 관리하기 위해서 색을 숫자로 구분한다.





2-1. 디지털 색상 체계 정리



1. HSB (Hue, Saturation, Brightness)
색상, 채도, 명도


2. Lab
L(명도) / a(초록↔빨강) / b(파랑↔노랑)
장치 독립 색공간으로, 고급 보정에 강하다.


3. CMYK (Cyan, Magenta, Yellow, blacK)
색의 삼원색(물감)으로 표현한 방법이다.
잉크의 구분이기에, 실제 인쇄를 할 때 사용하는 색감 체계다.


4. RGB
색의 삼원색인 Red, Green, Blue를 이용한 색상 체계.
255/255/255로 색상을 분류한다. 즉, 이미지는 빛의 3원색과 그 밝기 정보로 분해되며, 이 각각의 값은 0에서 255 사이의 숫자로 표현된다.


5. HEX 코드

#FFFFFF

RGB값을 16진법으로 표현한 색상 코드다.


예를 들어:

빨강 (255, 0, 0) → #FF0000

초록 (0, 255, 0) → #00FF00

파랑 (0, 0, 255) → #0000FF

HEX 코드는 각 자리에서 0~15까지 표현 가능하다.

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A(10), B(11), C(12), D(13), E(14), F(15)




2-2. 왜 HEX 코드를 언급하는가

HSB, Lab, CMYK, RGB는 모두 인간이 디지털로 색상을 다룰 때 필요하기 때문에 나온 색상 분류 개념이다. 그러나 HEX 코드는 다르다. 이 HEX 코드는 오로지 컴퓨터를 위해 나온 색상 분류 체계다.

기본적으로 컴퓨터 내부는 모두 이진수(0과 1)로 작동한다. 16진법은 4비트를 한 자리로 표현할 수 있기에, 이진수를 다루기가 쉬워진다. 예를 들어 이진수 1111은 16진수의 F다. 십진수로는 15다.

그래서 8비트(1바이트)를 두 개의 16진수 자리로 표현하면 쉽게 쪼개고 다룰 수 있다.

16진법 핵스코드 정리.png (예: 11111111 = FF)


하지만 우리는 HEX 코드는 안 쓸 것이다. RGB로 이야기를 도울 것인데, 그럼에도 HEX 코드에 대해 언급한 것은 PC가 이해하는 색상 체계를 컴퓨터의 언어로 이해하는 데 도움이 되기 때문이다. 이 직관만을 가져간 채 다음 글을 이어서 읽어주기를 바란다.


색 인식 3층 구조.png



3. 포토샵으로 이해하는 RGBA — 채널은 흑백 지도다


채널 예시1.png
채널 예시2.png

포토샵 오른쪽 하단에 레이어 패널을 보면, 채널(channel)이라는 패널이 보일 것이다.

눌러보면 이렇게 색상이 채널별로 분리되어 있다.




채널이란 무엇인가?

채널예시 4.png
채널예시5.png
채널 예시3.png
채널이란, 한 가지 색상 성분의 밝기 정보를 담은 흑백 이미지다. 예를 들어 0은 없음(검은색), 255는 최대(흰색)를 의미한다.

R 채널: 빨강 성분의 밝기(0=검정=없음, 255=흰색=최대)

G 채널: 초록 성분의 밝기

B 채널: 파랑 성분의 밝기


이렇게 나누는 이유는 사용자 입장에서는 특정 색만을 정밀하게 제어하기 위해서다. 가령 얼굴의 붉은기를 제거할 때에는 Red 채널에서 밝은 부분만 조정할 수 있을 것이다.

핵심은 이거다. 인간은 색을 한 번에 느끼지만, 컴퓨터는 각 색상 값을 숫자로 분리 저장하여 연산한다.

즉, 이 포토샵 채널 기능은 컴퓨터가 이미지를 보는 방식을 보여주는 도구인 것이다.











3-1. Alpha(α) 채널의 역할 — 합성의 가중치


채널예시6.png 오른쪽 하단에 있는 +를 누르면, 채널에는 기존에는 없던 알파라는 레이어가 추가된다.



A = Alpha = 투명도(Opacity)

AI를 다루다 보면, 앞으로 가장 중요하게 여겨질 채널이다. 바로 투명도를 관리하는 알파 채널의 역할이다.

알파 채널의 실제 역할은 픽셀이 얼마나 합성될지를 결정하는 데이터인데, 사용자는 투명도 혹은 불투명도라고 인지해도 좋다.

현재 알파 채널은 모두 검은색, 즉 0값으로 되어 있다. 내가 임의로 회색(128, 128, 128)으로 가운데를 칠했고, 또 오른쪽에는 흰색(255, 255, 255)으로 색을 칠했다.


알파채널 예시1.png
알파채널 예시2.png

우리에게는 이것이 색상으로 느껴지지만, PC에게는 정보로 보인다.

0(검은색): 불투명도가 적고,

255(흰색): 불투명도가 생긴다.


즉, 알파는 픽셀이 배경과 얼마나 섞일지에 대한 숫자다.




4. 인페인팅 — 빈 곳을 '숫자로' 메운다

이제 인페인팅을 보자.

이 기능은 이미지의 손상된 부분을 주변 맥락으로 복원하는 기술이다. 포토샵의 '내용 인식 채우기(Content-Aware Fill)', 혹은 '생성형 채우기(Generative Fill)'와 같은 개념이다.

AI는 비어 있는 공간(알파 채널)을 보고, 주변 픽셀들의 패턴을 분석한다. 그다음 그 패턴의 통계적 규칙을 따라 새로운 픽셀 값을 예측해 넣는다.

즉, AI는 그림을 그리는 것이 아니라, 숫자를 채워넣는 것이다.

단순히 "지우개로 지운 영역을 채워넣는 거예요~"라고 말할 수도 있을 것이다. 그러나 위에서 언급했던 PC가 이미지를 숫자로 이해하는 원리를 이해하고, AI가 잠재공간에서 이미지를 숫자로 학습한다는 그 원리만 이해한다면, 포토샵, 미드저니, 스테이블 디퓨전 등 앞으로 어떤 AI 툴이 나오더라도 두려울 게 없을 것이다.




4-1. 실제 영화 제작에서 사용했던 인페인팅 순서


인페이팅 예시1.png

AI는 한 번에 내가 원하는 이미지가 나오지 않는다. 그럴 때마다 이미지를 만드는 방법도 있지만, 이렇게 원하지 않는 영역을 지우고 새롭게 AI로 생성하는 방법도 있다. 이게 인페인팅이다.


위 이미지는 실제로 AI 단편영화를 제작할 때 사용한 방법이다. 의상을 제작할 때, 초기 이미지를 만들고, 원치 않는 부분은 인페인팅으로 변경하거나 없애서 사용했다.

실제로 썼던 순서는 이렇다.


① 우선순위 마스크
가장 먼저 시선에 크게 거슬리는 요소(간판 글자, 엉킨 전선, 의상 등)을 좁고 정확하게 지웠다. 핵심 오브젝트 중심으로.


② 경계 관리
인페인팅은 경계에서 티 나기 쉽다. 마스크를 깎을 때 1~3px 페더(feather)나 부드러운 브러시로 경계를 살짝 흐리게 만들어 블렌딩 단서를 주기도 한다. 경계를 AI로 합성하면 자연스러운 결과를 얻을 수 있었다.


③ 조명·색조명
채운 영역이 유난히 "새 것"처럼 떠 보이면, 포토샵으로 색보정을 하였다. 대공사는 필요 없다. 어떤 때는 포토샵의 AI 기능을 활용하기도 하였다.






5. 아웃페인팅 — 프레임 밖을 세계관으로 잇는다

엄밀히 따지면 인페인팅과 아웃페인팅의 원리는 비슷하다. 다만 인페인팅은 말 그대로 in, 이미지의 안쪽을 복원하는 개념이고, 아웃페인팅은 out, 이미지의 외곽을 확장하는 기술이다.

기존 이미지의 경계선을 분석해 그 바깥 영역을 자연스럽게 이어 만든다.

가령 AI의 경우 피사체의 클로즈업일수록 디테일하게 만들 수 있다. 당연하지만 피사체가 작을수록 디테일도 적어진다. 그렇기에 사람의 얼굴을 만들 경우 이런 식으로 클로즈업샷을 먼저 만들어서 얼굴의 디테일을 살린 뒤 아웃페인팅으로 다른 샷으로 확장해나가기도 한다.




5-1. 실제 영화 제작에서 사용했던 아웃페인팅 순서

좀 극단적인 예시로는, 아웃페인팅을 거듭하다 보면 극단적인 클로즈업샷에서 와이드샷으로도 만들 수도 있다. 이것의 장점은 단연코 얼굴의 디테일을 살릴 수 있다는 점이다. 그리고 프레임 바깥의 풍경을 AI로 만들 수 있다는 것이다.

내가 실제로 썼던 순서는 이렇다.


아웃페인팅 예시1.png

① 클로즈업 확정

인물의 피부 질감과 눈의 미세 하이라이트까지 만족할 때까지 클로즈업에서 승부. 이때 렌즈 감수성(예: 50mm 필름 감각, 얕은 심도, 보케 특성)을 컷의 문법으로 먼저 고정한다.



아웃페인팅 예시2.png

② 프레임 확장
아웃페인팅으로 상·하·좌·우 혹은 필요한 방향만 좁게 확장. 내가 원하는 곳에 피사체를 배치할 수 있다. 이후 단계의 안정성이 커진다.



아웃페인팅 예시3.png

③ 톤 통일

마지막에 전체 그레인·감마·로컬 콘트라스트를 컷셋 기준으로 통일한다. 원치 않는 오브젝트가 생성되었다면 이전에 소개한 인페인팅 기술로 수정을 거듭한다.





6. RGBA + Alpha = 인페인팅·아웃페인팅의 뿌리

이제 연결이 좀 보일 것이다.

RGBA는 AI가 이미지를 이해하는 기본 단위이고, 알파는 비어 있는 공간을 정의한다. 인페인팅은 그 빈 공간을 채우는 과정이고, 아웃페인팅은 그 공간의 바깥까지 확장하는 과정이다.



7. 왜 이걸 알아야 하는가

이 이론을 알면, 포토샵도 훨씬 단순해진다.


지우개 툴은 알파 값을 0으로 만드는 작업,

브러시 툴은 RGB 값을 새로 입력하는 작업이다.


AI의 인페인팅은 결국 이 두 가지 작업을 자동화한 것이다.

포토샵이 두려운 이유는 복잡함 때문이 아니다.


그저 '이미지가 숫자로 구성되어 있다'는 사실을 모르기 때문이다.

이 원리를 한 번 이해하면, AI 도구나 포토샵 모두 언어가 통하는 세계가 된다.

툴은 내일 또 바뀐다. 하지만 숫자로서의 이미지, 확률로서의 복원, 의도 있는 확장이라는 뼈대는 남는다.




(부록) 실습 체크리스트 — 오늘 글 그대로 따라 하기

☐ 포토샵 채널 패널에서 R/G/B 각 채널의 흑백 지도를 직접 확인했다.
☐ Alpha 마스크(0/128/255)를 만들어 전경·배경 합성을 시험했다.
☐ 인페인팅으로 원치 않는 오브젝트를 제거해 보고, 경계를 페더로 자연스러움을 맞췄다.
☐ 아웃페인팅으로 클로즈업 → 미들 → 와이드를 단계적으로 확장했다.

keyword
작가의 이전글2단계 – 프롬프트 설계의 방향성