김대원
“AI에 대한 사회적 관심을 더 높이는 동시에 다양한 논의의 재료로 쓰이기를 소망한다."
카카오 AI 리포트의 발행 취지였다. 리포트 편집진은 “AI와 관련된 다양한 내용을 꾸준히 소개하려 한다"는 큰 틀 하에서 “어려운 AI 기술과 개념들을 조금이라도 쉽게 풀어보거나, 다양한 이슈들을 점검해 보며, 새로운 소식들을 전할 예정"이라는 방향성을 밝힌 바 있다. 올 3월 발행된 이후, 이번 호까지 총 9차례 발행된 카카오 AI리포트를 톺아보며, 공언한 방향성을 점검하는 동시에, 2017년의 AI 트렌드를 정리해보았다.
[카카오 AI 리포트] Vol. 9 (2017년 12월 호) 는 다음 내용으로 구성되어 있습니다.
[1] AI & Mobility
01. 남대식, 서원호 : AI를 만나면 교통은 어떻게 똑똑해질까?
03. 양인철 : 인공지능 자율주행차가 교통체증을 없애줄까?
[2] Kakao Mini
[3] 2017년 AI
07. 김대원 : 카카오 AI 리포트로 본 2017년 AI
[04] information
08. 카카오AI리포트 필자가 추천하는 AI 공부 지침서
[카카오 AI 리포트] Vol. 9 전체글 다운받기
[카카오 AI 리포트] Vol. 9_07 다운받기
첫 호에서는 AI의 어제와 오늘이란 주제하에 글이 구성됐다. 기술, 윤리, 그리고 법차원에서 AI, 그리고 AI와 관련된 논의가 어떻게 발전 및 전개되어 왔는지에 대한 글이 게재됐다. AI의 개념부터 미국, 유럽 등 주요 지역에서 AI가 법적 테두리에서 논의되는 양상과 형태를 다룬 글과 로봇윤리 변천사를 4단계로 구분하여 정리한 분석은 공학적 영역에 비해 많지 않은 사회과학적 논의를 진행했기에 많은 관심을 받았다. AI 연구에 관심 있어 하는 사람들에게 요긴한 정보를 전달하는 역할을 할 인포메이션 섹션의 첫 번째 글에는 2017 AI 컨퍼런스와 AI 팟캐스트 정보가 담겼다. AI 리포트는 vol.1 부터 표지 디자인에 카카오에서 서비스되고 있는 AI 알고리듬의 실제 코드 일부를 발췌해 게재했다. 이러한 편집은 알고리듬 설명에 대한 책무에 카카오가 적극적으로 임하고 있음을 보여준다.
Vol.01 코드
다음앱 꽃검색에서 사용하는 코드 일부를 발췌/수정한 내용입니다.(http://mxnet.io 코드 인용) '다음앱 꽃검색'은 꽃 이미지 빅데이터를 딥러닝으로 학습하여 이용자가 사진을 찍었을 때 어떤 꽃인지 알려주는 서비스입니다.
두 번째 리포트에서는 김남주 카카오브레인 AI 연구 총괄의 글이 인기를 끌었다. ‘세상을 바꾸고 싶다면, 딥러닝'이란 김 연구 총괄의 글은 자신의 딥러닝 입문기 형식을 띄었다. 이 글에는 딥러닝의 주요 개념부터 향후 미래 가능성이 유쾌한 필체로 담겼다. 카카오 AI리포트 브런치에 게시된 김 연구 총괄의 글은 1,171회(2017년 12월 19일 현재)에 걸쳐 공유됐다. ‘AI, 지능정보기술개발 및 활용의 바람직한 방향’(권용현 미래창조과학부 지능정보사회추진단기획총괄팀 과장)과 ‘인간의 길, AI 로봇의 길’(한재권 한양대 융합시스템학과 교수)의 글은 다양한 관점에서 AI를 생각하고 싶었던 독자들의 바람을 충족시켰다는 평가를 받았다.
Vol.02 코드
‘카카오톡 치즈’에서 사용하는 얼굴 특징점 인식 및 검출(face alignment) 코드 일부를 발췌, 수정한 내용입니다. ‘카카오톡 치즈’는 모바일에서 실시간으로 얼굴의 특징점을 찾아 스티커를 붙이거나 카카오톡 프로필을 꾸밀 수 있는 앱입니다.
세 번째 리포트부터 카카오는 자사의 AI 서비스를 소상하게 설명하는 고정 코너를 마련했다. ‘AI in Kakao’로 명명된 이 코너는 AI 알고리듬의 결과인 서비스를 마주하는 이용자들에게 어떻게 해당 서비스가 제공되는 지를 쉽게 설명하고자 마련됐다. 첫 번째로 소개된 서비스는 카카오맵 로드뷰(roadview)에 적용된 객체 검출 기술이었다. 객체 검출 기술은 특정 지역의 실제 모습을 이용자에게 전달하기 위한 영상에서 사람과 자동차 번호판 등을 검출한 뒤 제거하는 목적으로 활용됐다. 이러한 조치는 로드뷰 서비스로 인해 개인의 프라이버시가 침해되는 것을 막기 위한 것이다. Vol.3에는 머신 러닝 국제 컨퍼런스와 신경 정보 처리 시스템학회에서 2005년부터 2016년 사이에 발표된 논문 6,163건을 취합한 메타분석의 결과를 게재했다. 이 분석은 리포트 편집진이 직접 수행한 것이었다.
Vol.03 코드
표지 코드는 다음뉴스의 ‘나를 위한 추천’ 서비스를 구성하는 토로스 추천 시스템의 알고리듬 일부를 발췌한 것입니다. ‘나를 위한 추천’은 딥러닝 기술을 이용하여 뉴스 이용자의 소비 패턴과 소비한 기사의 내용을 학습하고, 개인별로 맞춤형 기사를 제공하는 서비스입니다.
Vol.4에서는 카카오 콘텐츠 추천 알고리듬이 소개됐다. 이 알고리듬은 다음뉴스, 다음스포츠, 1boon, 카카오톡채널, 브런치, 카카오페이지, 카카오뮤직, 카카오TV 등에 적용된 것이었다. 카카오의 여성 AI 인력을 대상으로 진행했던 ‘AI 톡(AI Talk)’은 AI와 다양성이란 화두에 대해 다시 한 번 생각할 수 있는 기회가 됐다는 평가를 받았다. AI 톡에 참여한 여성 AI 서비스개발 인력은 총 5명이었으며, 사회는 경력 16년차의 여성 개발자가 맡았다.
2회로 기획된 알파고의 학습 알고리듬인 강화학습에 대한 설명 글이 vol.4 부터 게재됐다. 카카오 사내 독서모임인 ‘임팩트북클럽'에서 추천한 AI 관련 도서가 ‘AI 그리고 미래 사회를 위한 책들'이란 제목으로 게재됐다.
Vol.04 코드
For you는 2004년부터 멜론에 쌓인 이용자들의 사용데이터를 분석하여, 이용자들이 좋아할만한 음악을 다양한방식으로 추천하는 ‘지능형’ 음원 큐레이션 서비스입니다.
다섯 번째 리포트는 의료에 집중했다. 의료분야의 AI 권위자 6명을 섭외했다. 의료AI의 어제 부터 주요 사례, AI 중심의 의료시장 구도, 그리고 AI가 적용된 기술의 윤리에 대한 논의까지 다뤘다. 사실상 AI와 의료에 대한 모든 이야기를 다 해보자는 취지에서였다. 겨우내 온돌방에서 ‘AI와 의료’, 이 화두를 종합적으로 그리고 빠르게 훑어보고자 하는 분들에게 다섯 번째 리포트를 추천한다. Vol.5에는 AI가 적용되어 더욱 똑똑해진 카카오 광고서비스의 구조를 설명하는 글도 담겼다. 공상과학에서 주된 소재로 다뤄지는 AI와 인간 간의 교류. 이것이 현실에서도 이뤄질 수 있을까? 에 대한 답을 찾아본‘AI는 인간과 같은 감정을 가지게 될까?’란 제목의 글은 지능 일색의 논의와 달리, 감정을 키워드로 AI를 바라본 새로운 관점을 제공했다.
Vol.05 코드
카카오의 서비스에 접속한 사용자의 니즈에 가장 부합하는 광고를 선택, 노출하기 위해서 사용자, 광고 소재 및 매체의 정보를 이용해서 광고 소재를 추천하는 알고리듬입니다.
AI 경쟁력의 결정요인을 알고리듬, 데이터, 그리고 컴퓨팅 파워로 분류하기도 한다. 이 중, 요긴한 데이터의 확보 여부와 확보한 데이터를 적절하게 가공하고 다루는 기술은 AI 경쟁력의 차이를 만든다. Vol.6에서는 기계학습을 실제 현장에 적용할 때 겪게 되는 데이터와 관련된 어려움을 소개하는 글이 담겼다. ‘머신 러닝 적용의 실제: 논문이 가르쳐 주지 않는 것들’이란 제목이 붙은 이 글은 누적 공유 수가 1,183회(2017년 12월 19일 기준)에 달할 정도로 많은 주목을 받았다. 음성인식의 개념과 카카오에 적용된 음성형 엔진의 개괄적 구조를 설명한 글도 vol.6을 외부에서 많이 찾게 하는 계기로 작용했다. 당시, 2017년 9월 15일 출시된 현대차의 제네시스 G70에 카카오I의 음성형 엔진이 탑재되면서, 카카오의 유관기술에 대한 관심이 높아진 상태였다.
Vol.06 코드
음성인식 엔진의 음향모델을 학습하기 위한 알고리듬 일부를 발췌한 것입니다. 음향모델은 음성신호의 특징을 추출하여 모델링하는 것으로 딥러닝 기술을 이용하여 학습합니다. 음성인식은 다음앱, 카카오맵, 카카오내비의 음성검색에 적용되어 서비스 중입니다.
추석 연휴로 인해, 카카오 AI리포트는 9월이 아닌 10월 말에 9/10월 합본호로 발행됐다. 합본호에서 가장 눈에 띄인 글은 카카오미니에 대한 두 설명 글이었다. 카카오의 스마트 스피커인 카카오미니는 9월 18일 예약 판매를 통해 대중에게 다가갔다. 3000대 한정으로 진행된 예약 판매 결과는 38분만의 매진이었다. Vol.7에서 카카오미니 섹션은 높아진 카카오미니에 대한 궁금증을 해소하는 차원에서 마련됐다. 카카오미니 프로젝트의 실무 총괄인 이석영 님이 직접 쓴 ‘음성 인터페이스와 스마트 스피커’의 내용은 언론 기사에 활용될 정도로 많은 관심을 받았다. 뉴스 추천에 이용자의 실제 콘텐츠 소비 시간까지 반영하는 방식으로 또 한 번 진화한 카카오의 추천 엔진에 대한 설명도 vol.7에 게재됐다. 기존 알파고를 모두 무찌를 정도로 고도화 된 알파고 제로에 대한 해제도 vol.7의 내용을 풍성하는 데 기여했다.
Vol.07 코드
표지 코드는 모바일 다음 메인 화면의 뉴스 기사와 콘텐츠 추천에 적용되는 카카오I(아이)의 추천 엔진 알고리듬일부를 발췌한 것입니다.
Vol.8에서는 기계번역의 역사, 그리고 기계번역 측면에서의 카카오 기술의 강점을 소개하는 글이 게재됐다. 이 밖에도 AI와 조금은 먼 영역으로 생각될 수 있는 예술의 시각에서 AI를 어떻게 바라보고 있는 지를 살펴보고자 했다. 이는 두 분의 미디어아트 작가의 글을 통해 시도되었다. 당시의 핫 이슈였던 제프리 힌튼의 캡슐망에 대해 상술하는 글도 게재했다. 석・박사 생을 위한 카카오의 상시 지원프로그램에 대한 자세한 설명도 vol.8에 포함됐다.
Vol.08 코드
Parallel corpus 추출을 위한 alignment tool의 알고리듬 일부를 발췌한 것입니다. 카카오는 기존 규칙 기반 접근의 한계를 극복하기 위해 딥러닝 기반의 alignment 알고리듬을 사용했고, BLEU에 word embedding 기법을 적용하여 ABLEU라는 더 개선된 측정법을 고안하여 사용했습니다.
2017년에 발행된 카카오 AI리포트의 PDF 파일을 모아둔 카카오 정책지원파트 브런치 입니다.
URL : https://brunch.co.kr/@kakao-it/171
글 | 김대원 ive.kim@kakaocorp.com
카카오 AI리포트의 12월호를 매듭하며 후련한 마음과 동시에, 2018년 만들어야 하는 12개의 AI리포트를 걱정한다. 박사과정 이후 미디어산업과 전략을 전공하고 있다. 로봇저널리즘을 시발로 하여, AI의 사회적 수용 및 확산 그리고 유관된 사회적 이슈 및 윤리에 대해 연구 중이다.