[카카오AI리포트] 발표: 남기훈 / 글: 김동현
01. 지식그래프 : 카카오미니와 검색 적용 소개 (발표: 남기훈 / 글: 김동현)
02. 눈으로 듣는 음악 추천 시스템 (발표: 최규민 / 글: 김태훈)
03. 이미지로 이미지 검색하기 (발표: 이주영 / 글: 이가람)
04. 딥러닝을 활용한 뉴스 메타 태깅 (발표: 김기도 / 글: 김규형)
05. 딥러닝을 이용한 실시간 인코딩 효율 최적화 (발표: 여욱형 / 글: 정소영)
06. 카카오 봇 플랫폼 소개 (발표: 황지수 / 글: 이형남)
07. 카카오가 가지고 있는 음성처리 기술 (발표: 노재근 / 글: 이형남)
08. 딥러닝을 이용한 얼굴 인식 (발표: 신종주 / 글: 김동현)
09. TOROS N2 (발표: 김성진 / 글: 김태훈)
10. 텐서플로로 OCR 개발해보기: 문제점과 문제점과 문제점 (발표: 모종훈·오형석 / 글: 이가람)
11. S2Graph와 GraphQL (발표: 윤도영 / 글: 김규형)
12. AI시대에 맞는 서비스 개발(발표: 이석영 / 글: 정소영)
인터넷을 검색하다 보면 답답한 순간들이 많다. 찾아내고 싶은 것이 있는데 목적과는 다르게 검색 결과는 엉뚱한 결과들만 나열한다. 예컨대 이효리 남편이 소속된 그룹에 어떤 멤버들이 있는지 궁금할 때 이것을 검색으로 찾는다고 가정해보자. 가장 직관적인 검색 방식은 ‘이효리 남편이 소속된 그룹의 멤버’라고 검색하는 것이지만, 우리가 만족할 만한 결과가 나오지 않는다. 다음으로 생각해볼 수 있는 방식은 ‘이효리 남편’을 검색하여 ‘이상순’이라는 결과값을 얻은 후, 다시 ‘이상순의 그룹’을 검색해보는 것이다. 그리고 이에 대한 결과값인 ‘롤러코스터’를 클릭하여 ‘조원선’이 해당 그룹의 멤버임을 알아낸다. 이렇듯 우리는 원하는 정보를 찾아내기 위해 적잖은 불편을 감수해야 한다.
이 글에서는 이러한 검색의 불편함을 해소할 수 있는 ‘카카오 지식그래프와 적용’에 대해 다루어보고자 했다.
지식그래프란 관련 있는 정보와 지식들을 서로 연결해놓은 것을 의미한다. 예를 들어 기존에는 ‘아이유’와 관련된 정보인 직업, 성별, 소속사, 데뷔 연도 등이 각각 다른 문서에 분절되어 저장된 상태였다면, 지식그래프에서는 이들을 ‘아이유’와 관련 있는 것으로 모두 엮어놓는다. 하나의 생각이 꼬리를 물고 관련된 다른 생각으로 이어지는 마인드맵처럼 지식들을 이어놓은 것으로 이해할 수 있다. 따라서 지식그래프에서의 ‘검색어’는 단순히 독립된 텍스트를 넘어 주변 정보들과 관계를 지니는 의미어로 확장된다.
이렇듯 지식그래프의 연결된 특성은 사용자의 검색을 편리하게 해준다. 앞에서 언급한 예제의 경우 지식그래프를 활용한다면, ‘이효리 남편이 소속된 그룹의 멤버’라고만 검색하여도 ‘조원선’이라는 결과값을 곧장 얻을 수 있다. 아래 사진에서와 같이 이효리 – 이효리의 남편 이상순 – 이상순의 그룹 롤러코스터 – 롤러코스터의 멤버 정보가 유기적으로 연결되어 있기 때문이다. 기존 검색보다 사용자가 훨씬 편리하게 원하는 정보를 찾을 수 있게 된 것이다.
이것은 사람이 컴퓨터와 소통할 때, ‘이렇게 말하면 컴퓨터가 이해하겠지?’라는 다소 불편한 단계를 생략할 수 있게 된 것으로 볼 수 있다. 컴퓨터의 처지를 고려하지 않고 사람의 표현 방식으로 이야기를 하더라도 컴퓨터가 사용자의 의도를 척척 파악하는 ‘대화형’ 검색이 가능해지는 것이다. 카카오의 지식그래프에는 지금까지 약 12억 건 정도의 그래프가 연결되어 있으며, 그 수가 늘어날수록 이러한 대화형 검색이 용이해질 것으로 보인다.
대화형 상호작용을 가능케 하는 지식그래프는 카카오의 AI 스피커인 카카오미니에도 적용되고 있다. 카카오미니는 음성으로 사용자와 상호작용이 일어나기에 지식그래프의 관계 기반, 의미 기반 검색의 장점을 활용하는 데 적합한 서비스라 생각된다.
예를 들어 카카오미니에게 “트와이스 리더의 나이가 몇이야?”라고 물었다고 가정해보자. 만약 지식그래프를 활용하지 않았다면 카카오미니는 해당 명령어를 인식하지 못했을 가능성이 크다. “트와이스 리더가 누구야?”, “지효 나이” 등을 묻는 단계를 거쳐야만 “지효의 나이는 만 21세예요”라는 답을 줄 수 있을 것이다. 하지만 현재 카카오미니는 지식그래프 기술을 적용하고 있기에 단 하나의 질문만으로도 “트와이스의 리더의 나이는 만 21세예요”라는 답을 할 수 있는 것이다. [그림 2]에서 ‘Cruise KG’에 해당되는 것이 바로 지식그래프로, 이는 트와이스 리더–지효–나이–만 21세 등 일련의 연결된 정보 그래프로 구성되어 있다.
이렇듯 지식그래프는 기술적으로는 훌륭하지만, 이를 카카오의 서비스에 적용하는 데는 나름의 어려움이 존재한다. 사용자들이 지식그래프를 활용하는 검색 방식에 익숙지 않기 때문이다. 예컨대 “아이유 동문인 연예인 알려줘”라고 검색을 하면 결과가 나오지 않을 것으로 예상한 사용자들이 기존의 검색 방식을 고수하고 있다는 것이다.
이와 같은 방식은 사용자 입장에서는 시행착오를 통해 터득한 최상의 검색 방식이기에 이를 바꾸기가 쉽지 않다. 혹시나 하는 마음에 입에서 나오는 말 그대로 검색했다가 원하는 결과를 얻지 못한 경험이 누구나 한 번씩은 있었을 것이다. 지식그래프라는 유용한 검색 도구가 있음에도 사용자들이 기존의 검색 방식에서 탈피하기 쉽지 않은 이유이다. 카카오를 비롯해 지식그래프를 활용하는 기업들이 사용자의 검색 방식을 어떻게 변화시켜야 할지 고민해야 할 필요가 있어 보인다.
해당 콘퍼런스에 참여한 후 지식그래프에 대한 몇 가지 생각들이 떠올랐다.
첫째, 지식그래프가 마치 사람의 인지구조와 유사하다는 느낌을 받았다. 스위스의 철학자이자 심리학자인 장 피아제(Jean Piaget)에 따르면 인간은 도식(schema)을 바탕으로 세상을 이해한다고 한다. 여기서 도식이란 인간이 세상을 바라보는 틀이며*1, ‘날아가는 것=새’와 같이 일련의 지식들이 구조화된 것이라 볼 수 있다. 이에 지식그래프가 이러한 인간의 도식과 상당히 유사하다는 느낌을 받았다. 또한 뇌에서 하나의 뉴런은 보통 1만여 개의 다른 뉴런과 연결되어 네트워크를 이루는데*2, 지식그래프가 이러한 뉴런의 체계와도 유사하다는 인상을 받았다. 기계를 통해 인간의 뇌를 모방하고자 했던 목표*3가 현실화되고 있는 것이 아닐까.
둘째, 지식그래프는 단순한 검색을 넘어 AI가 관계의 대상이 될 수 있도록 기여할 것이라는 생각이 들었다. 지식그래프 덕분에 사용자는 자신에게 가장 친숙한 표현을 사용하여 컴퓨터의 반응을 얻을 수 있게 되었다. ‘컴퓨터를 이해시키는 말을 한다’에서 ‘컴퓨터가 내 말을 이해한다’로 관계가 전환되는 것이다. 그리고 이렇게 전환된 관계로 인해 AI는 단순히 편의성만을 제공하는 것을 넘어 ‘관계의 대상’이라는 가치 있는 역할을 할 것으로 생각한다.
콘퍼런스 발표 | 남기훈 kane.nam@kakaocorp.com
글 | 김동현 dobedh@gmail.com
서울대학교에서 교육상담을 전공하였습니다. 사람에게 관심이 많아 학부에서는 심리학을, 대학원에서는 상담을 공부하였습니다. 만드는 것에 대한 열정과 사람에 대한 관심으로 세상에 기여하고자 합니다. 보다 성장하는 기획자가 되기 위해 노력하고 있습니다.
참고문헌
*1 참고 | 신종호(2011), 《교육심리학: 교육실제를 보는 창》, 피어슨에듀케이션코리아
*2 참고 | 강봉균(2013), 〈뇌 이해하기〉, 한국분자·세포생물학회
*3 참고 | 김대식(2016). 《김대식의 인간 vs기계: 인공지능이란 무엇인가.》 동아시아
[카카오 AI 리포트] Vol. 14 (2018년 9월 호)는 다음 내용으로 구성되어 있습니다.
[1] Special Topic
01. 김동현 | 지식그래프 : 카카오미니와 검색 적용 소개
05. 정소영 | 딥러닝을 이용한 실시간 인코딩 효율 최적화
[2] In-Depth
08. 박성건, 이수원 | 스포츠 경기력 향상을 위한 AI 활용 방안
09. 최형준 | 스포츠 경기 분석 전문가와 AI의 만남
10. 신동윤 | 로봇 심판과 판정 알고리즘의 의미 있는 도전
11. 박주희 | 스마트 도핑 검사의 도입과 발전 과제
12. 김동환 | 스포츠 저널리즘의 변화와 AI의 활용
[3] Tech Insider
14. 윤도영 | Apache S2Graph 기반 머신러닝 모델 환경 구축
15. 이수경, 박규병 | 딥러닝이 탐구하지 못한 언어와 5가지 태스크
16. 박찬연 | 2018 ICML을 통해 살펴보는 AI 연구 동향
17. 황순민 | 2018 CVPR 논문 동향 및 주요 연구 소개
[카카오 AI리포트] Vol. 14 전체글 다운받기
[카카오 AI리포트] Vol. 14_1 다운받기