Visual search : AI가 유사 이미지를 검색해 내는 과정
아이들이 입에 늘 달고 사는 말이 있습니다.
엄마, 아빠, 저건 뭐야?
처음 본 사물을 지식 자산으로 축적하려는 의도가 담겨있는 질문이죠. 주위에 답을 줄 사람이 있다면 쉽게 해결될 일이지만, 그렇지 않을 때도 있습니다. 그럴 때면 아이는 한참 동안 해당 사물을 들여다보다가 답답한 마음을 안고 뒤돌아 서겠죠.
어른이 돼서도 비슷한 상황이 있습니다. 어린아이 때 보다 지식수준이 높아짐에 따라 “저건 뭔가요?”라고 묻는 빈도는 낮아지지만, 해당 사물을 묘사해서 질문하기 어려울 때 특히 그렇습니다.
홀로 해외여행을 떠났을 때 아주 멋진 건물이나 조각상을 맞닥뜨렸다고 가정해봅시다. 오디오 가이드도, 안내판도 없고 외국어 구사력에도 자신이 없어 지나가는 현지인을 붙잡고 물어보기도 어렵습니다. 그렇다고 해도 이젠 답답한 마음을 안고 뒤돌아설 필요는 없습니다. AI를 활용한 유사 이미지 검색 기술이 날로 발전하고 있거든요.
핵심 원리는 수십억 건의 대용량 데이터베이스 중 가장 비슷한 이미지를 빠르게 찾아내는 데 있습니다.
실제 상황을 예로 들어볼께요. 프랑스 파리 몽마르트르 언덕에 올라 큰 건물을 만났습니다. 배경 지식이 없는 저는 크고 흰 건물이 무엇인지, 어떤 역사를 담고 있는지 알고 싶습니다. 이때 스마트폰을 꺼내 ‘찰칵’. 그리고 사진을 유사 이미지 검색 질의어로 설정합니다. AI 신경망은 사진을 여러 갈래로 분할해 각 영역을 숫자 배열(벡터)로 인식합니다. 이후 수십억 장의 데이터 베이스 중 벡터 유사도가 가장 높은 이미지를 답변으로 내놓습니다. 이미지가 품고 있는 맥락을 파악해주는 셈이죠.
촬영한 이미지는 사크레쾨르 대성당(Basilique du Sacré-Cœur)과
가장 유사해 보입니다.
이 복잡한 연산이 이뤄지는데 필요한 시간은 단 0.01초. 더 많은 사람들이 이용해 데이터베이스가 쌓일수록 연산 속도와 정확도는 꾸준히 향상될 전망입니다.
이 기술의 활용 영역은 다양합니다. 미술에 대해 잘 모르더라도 화랑에서 멋진 그림을 봤을 때 스마트폰 셔터 한 번으로 어떤 작품인지 풍성한 설명을 마주할 수 있습니다. 마음에 쏙 드는 옷을 입은 친구에게 “그 옷 어디서 샀어?”라고 물어보기 머쓱하다면, 유사 이미지 검색을 활용해 브랜드와 최저 가격을 알아낼 수도 있습니다. 카카오는 이 기술을 연내 커머스 서비스에 상용화할 예정입니다.
어쩌면 가까운 시간 안에 “그 옷 어디서 샀어?”라는 질문이 사라질지도 모를 일입니다.
kakao i 멀티미디어 처리 기술에 관한 글 목록
(발행한 글)
- 라이언의 코, 어떻게 내 코를 따라다닌거지? (Face Alignment 기술)
- 벚꽃과 살구꽃, 구분할 수 있나요? (Convolutional Neural Networks 기술을 활용한 꽃검색)
- 유명해야만 '얼굴이 명함'일까요? (얼굴 인식 기술)
(이번 글)
- “그 옷 어디서 샀어?”라는 질문, 사라질 수도 있다 (유사이미지 검색 기술)