확산 모델(Diffusion Model)이 수능 국어 영역에 출제
올해도 어김없이 수능이 진행되었습니다. 수능일이면, 국어 영역 문제와 수학 영역 문제는 한 번씩 다운로드하여서 어떤 문제가 나왔는지 살펴봅니다. 개인적으로 애정하는 지구과학 분야에도 어떤 문제가 나왔는지 봅니다. 수학 영역의 1번을 암산으로 풀 수 있는지 도전해 보고, 국어 영역에서는 비문학 영역에서 어떤 분야가 출제되었는지도 훑어보는데요.
국어 영역 문제를 스크롤해서 보다가 두 눈을 의심케 하는 문제를 보고 말았습니다.
아니 확산 모델이라니!!!
확산 모델이라는 말보다는 디퓨전 모델이 익숙해서, 디퓨전(Diffusion) 모델로는 앞으로 표현하겠습니다. 디퓨전 모델은 생성형 인공지능 기술 중 하나로, 최근 이미지를 생성하는 인공지능에 널리 활용되는 기술입니다. 디퓨전이라는 이름에서 알 수 있듯이, 물에서 잉크가 확산되듯, 노이즈를 확산시키는 방식을 이용하여 이미지를 생성하게 됩니다.
우리가 그림을 그릴 때는 빈 종이에서 시작해서 집도 그리고, 하늘도 그립니다. 하지만 디퓨전 모델은 반대로 진행됩니다. 먼저, 완성된 원본 그림을 가지고 옵니다. 그리고 이 그림에 노이즈를 확산시키죠. 노이즈가 많아질수록 그림이 흐려지고, 결국에는 아무것도 보이지 않는 상태가 됩니다.
그리고 인공지능에게, 노이즈가 잔뜩 낀 흐릿한 그림을 원래대로 돌려놓으라고 이야기합니다. 그러면, 인공지능은 흐릿한 그림이 원래 이렀다는 것을 학습하게 됩니다. 노이즈를 다시 줄여나가는 과정을 통해, 원래 그림을 추측하는 것이죠. 이러한 과정을 통해 인공지능은 새로운 그림을 만들 수 있습니다.
위 내용을 자세하게 풀어쓴 게 올해 수능 지문이었습니다. 보통은 그냥 문제가 나왔구나 하고 넘어갔지만, 인공지능으로 밥 벌어먹고 사는 사람으로 지나칠 수가 없어 문제를 풀어보기로 했습니다. 그런데, 확산 모델이라는 말부터 막힙니다. 늘 영어로 풀어쓰던 용어가 한글로 되어 있으니, 더욱 헷갈립니다. 잠재 표현, 역확산 과정 등 모든 용어가 낯서네요.
디퓨전 모델을 자주 접한 저도 문제가 헷갈리는데, 학생들에게는 꽤나 버거운 문제가 아니었을까 생각이 듭니다. 그나마, 인공지능에 대한 이해도가 높은 친구들에게 유리했을 것 같은데요.
비문학 문제는 시의성 있는 문제들이 출제되곤 합니다. 그리고 인공지능 관련 지문이 비문학에 등장했다는 것 자체가 인공지능이 오늘날 어떤 위상인지를 알려주는 것만 같습니다.
디퓨전 모델은 오늘날 이미지 생성형 인공지능 모델은 모두가 쓰고 있다 해도 과언이 아닌데요. 이미지 생성에 자주 활용되는 스테이블 디퓨전(Stable Diffusion) 모델이 이름에서 알 수 있듯이, 디퓨전 모델을 활용합니다. 그리고 이 스테이블 디퓨전을 미드저니가 활용하고 있죠.
아래 이미지는 스테이블 디퓨전을 활용해서 직접 그린 그림입니다. 바다를 배경으로 하는 일본풍 마을에 있는 소년을 그려달라고 요청했는데요. 왼쪽 그림은 신카이 마코토 애니메이션 스타일로 그려달라고 추가 요청을 한 결과이며, 오른쪽 그림은 <닥터 슬럼프> 스타일로 그려달라고 요청한 결과입니다. 이미지 생성 인공지능의 실력이 놀랍지 않나요?
이처럼 인공지능을 다루는 사람에게는 익숙한 디퓨전 모델이지만, 학생들에게는 생소했나 봅니다. 예년대비 쉬운 것으로 평가받는 올해 수능 국어영역이지만, '노이즈'가 자주 언급된 인공지능 문제가 나름의 킬러 문제였다는 기사가 나오네요.
인공지능을 미리 공부했더라면, 이 문제가 좀 쉽게 다가오지 않았을까요?
그런 의미에서, <1일 1단어 1분으로 끝내는 AI공부>를 추천드립니다. :)
당초에는 국어 영역 문제 풀이도 적어보려 했으나, 오버인 것 같아 디퓨전 모델 소개 및 활용 사례만 넣어 봤습니다. 여러분도 한 번 문제에 도전해 보시길!