brunch

You can make anything
by writing

- C.S.Lewis -

by 카카오 May 04. 2018

AI와 생활의 연결

카카오 AI 부문장 클로드

한 번에 몰아보기




들어가며



인공지능 기술은 우리 주변에서 제법 많은 곳에 쓰이고 있습니다. 보안처럼 보이지 않는 곳에서 부지런히 일을 하는 인공지능 기술도 있고, 음성 비서처럼 직접 우리와 맞닿아 있는 기술도 있습니다. 특히 스피커는 가까이할 수 있는 인공지능의 도구로, 요즘 가장 관심을 받는 IT 제품이기도 합니다.


카카오를 비롯해 아마존, 구글 등 많은 기업들이 말로 명령을 내리고, 원하는 정보를 얻을 수 있는 스피커를 내놓고 있습니다. 이를 두고 흔히 ‘인공지능 스피커’라고 부르지만 사실 정확하게는 이 스피커 자체가 엄마처럼 이용자에게 닥친 문제를 알아서 해결해줄 수 있는 인공지능을 갖고 있는 것은 아닙니다. 다만 음성 인식, 자연어 처리 등 우리가 스피커와 대화할 수 있도록 해 주는 기반 기술들이 더해져서 스피커를 똑똑하게 만드는 겁니다. 


카카오는 왜 스피커를 인공지능 접점으로 골랐나


카카오 역시 ‘카카오미니’라는 스피커를 내놓고 있습니다. 카카오는 왜 스피커를 개발했을까요? 카카오의 AI 부문장인 클로드는 카카오미니를 통한 카카오의 철학과 기술, 그리고 이를 통해 카카오가 보여주려는 것이 무엇인지에 대해서 이야기를 꺼내 놓았습니다.

카카오의 모토는 모든 것은 연결한다는 것에 있습니다. 그래서 연결에 대한 고민을 많이 했고, 어떤 연결이 중요한지에 대해서 많은 생각을 했습니다.

카카오의 출발은 모두가 알고 있는 카카오톡이지요. 바로 사람과 사람을 잇는 커뮤니케이션이었습니다. 지금까지도 이 연결은 카카오의 가장 기본 철학이라고 합니다. 클로드는 카카오가 인공지능 기술을 고민하던 출발점 역시 커뮤니케이션이라고 설명했습니다. 당연한 이야기처럼 보일 수 있지만 서비스가 출발하는 철학은 결과물에 큰 차이를 빚어내게 마련입니다.


사람과 사람을 잇는 카카오톡의 커뮤니케이션

 

이 고민의 시작은 ‘인터넷’이었다고 합니다. 컴퓨터가 처음 네트워크로 연결되고 인터넷으로 묶인 뒤 점차 많은 일들이 인터넷을 통해 이뤄지게 됐습니다. 세상이 모두 연결된 것처럼 느껴졌지만 모바일이 등장하면서 우리는 그 동안의 연결과는 다른, 그러니까 스마트폰을 통한 완전한 연결을 경험하게 됐습니다.


"모바일 시대에 인공지능 기술이 더해지는 것에 대해 생각하다 보니 아직도 세상에는 연결되지 않은 무엇인가가 많다고 생각했습니다. 인공지능은 이를 연결해주는 매개체가 될 것이라고 봤습니다. 어떻게 쓰일지에 대해서만 충분히 고민된다면 스마트폰이 그랬던 것처럼 컴퓨팅 환경에 큰 변화가 다가올 겁니다.”


스마트폰이 기존의 인터넷과 가장 다른 부분은 바로 ‘온라인’이라는 개념이었습니다. 그 전에도 우리는 메신저를 썼지만 누군가와 이야기를 나누려면 상대방이 접속할 때까지 기다려야 했습니다. 메모를 남겨 놓을 수는 있었지만 온라인과 오프라인의 구분은 아주 명확했습니다. 하지만 스마트폰과 모바일 인터넷 시대가 열리면서 우리는 항상 온라인 상태를 유지할 수 있게 됐습니다. 우리는 잠들 때까지도 스마트폰을 끌어안고 있지요.


그런데 그 항상 온라인 상태를 유지하는 방법은 그 이전의 컴퓨터 시대와 다르지 않습니다. 켜져 있는 기기를 항상 몸에 지니고 있다는 것이지요. 클로드가 구분하는 인공지능 시대의 가장 큰 변화는 커뮤니케이션을 위해 기기를 꼭 쥐고 있지 않아도 된다는 점이었습니다.



“목소리를 이용하기 때문에 마이크가 허용하는 안에서 몇 미터 떨어져서도 커뮤니케이션이 시작되고 정보에 접근할 수 있습니다. 서비스 제공자도 웹 페이지를 만드는 것 대신 질문에 대한 적절한 답과 정보를 정리해두는 것으로 서비스의 형태가 달라지게 될 겁니다.”



카카오미니는 하나의 ‘모습'


커뮤니케이션과 정보 접근성은 카카오의 인공지능 기술의 중요한 출발점이 됩니다. 결국 커뮤니케이션을 시작하게 되면 그 뒤로는 복잡한 시나리오들이 만들어질 것이라는 게 클로드의 설명입니다. 카카오미니가 바라보는 목적도 바로 기본적으로 기기와 대화를 나눌 수 있는 접점이 되는 겁니다.


클로드가 처음 원했던 카카오미니의 형태는 ‘보이지 않는 것’이었다고 합니다. 마이크의 모양을 숨기고 더 많은 곳에 적절히 배치해서 아무 곳에서든 말로 원하는 명령을 내리는 것이 궁극적인 목표라는 겁니다. 결국 지금은 스피커의 형태를 하고 있지만 그 스피커의 모양이 카카오미니의 전부는 아니라는 이야기지요.



이 기술이 소매점에 놓이게 되면 직원을 찾지 않아도 원하는 정보를 안내받을 수 있고, 자동차에 들어가면 운전중에도 안전을 방해받지 않고 차량을 제어하거나 필요한 정보를 얻게 되는 것이지요. 우리는 또 다시 달라진 세상에서 살게 될 겁니다.


결국 카카오미니는 처음 현실로 만든 모양이고 이게 나중에는 어떤 모습으로든 바꿀 수 있는 구조라고 합니다. 클로드는 단순히 스피커라는 고정관념으로만 바라보지 말아달라고 당부합니다. 스피커라는 틀을 벗어나는 상상력이 제품과 서비스를 만드는 데에 도움이 될 것이라는 말도 덧붙였습니다.


인공지능 기술 열풍에 대해 각 기업들이 꺼내 놓은 수많은 스피커들은 비슷한 듯 서로 다른 목표지점을 바라보고 있습니다. 지켜보는 입장에서는 제품이나 기능에 따라 ‘이걸 왜 인공지능 스피커라고 부르는가’에 대해 묘한 혼란이 오기도 합니다. 카카오가 대화 그 자체를 떠나 카카오미니를 통해 무엇을 이루려고 하는지 목표와 철학이 명확해야 이용자나 생태계에 참여하는 서비스들도 제품을 받아들이기 쉬울 겁니다.


인공지능을 통한 커뮤니케이션


클로드는 음성으로 대화할 수 있는 연결 고리를 만들고, 어떤 형태의 접접을 이용하든 커뮤니케이션을 통해서 이용자가 서비스에 필요한 것들을 요구할 수 있는 것에서 카카오미니가 시작된다고 설명합니다. 그리고 또 한 가지, 기기와 서비스가 당장 이용자의 명령 없이도 무엇인가 필요한 것을 알아서 해주는 형태로 진화하는 것을 중요한 과제로 꼽고 있다고 합니다. 결국 클로드는 “서비스와 생활의 연결을 통해 인공지능 기술을 집사로 만드는 것”이라는 비전으로 연결했습니다.


카카오미니는 어떻게 대화를 할 수 있나


카카오의 비전은 모든 것을 연결한다는 의미, ‘커넥트 에브리띵(Connect Everything)’에 있습니다. 카카오는 인공지능 시대의 연결을 위해서 정보, 사람, 오프라인, 사물을 연결하는 비전을 만들고 있습니다. 그 중심 기술은 ‘카카오 I’로 집중됩니다.



카카오 I는 카카오 인공지능의 가장 기반이 되는 기술입니다. 음성, 시각, 대화, 추천, 번역 등 사람이 보고 듣고 이해하는 것들을 도구로 만들어 놓은 것입니다. 카카오 스스로도 이 기술들을 엮어서 카카오미니를 비롯해 사진 분석, 인터넷 검색, 번역 등의 서비스를 만들어내고 있습니다. 각 서비스를 조금씩 더 알아볼까요?


음성 인식과 시각 엔진을 이용한 서비스들


“음성 인식은 카카오가 오랫동안 쌓아온 기술입니다. 음성 인식 전체 과정에 대해서 자체 기술을 갖고 있습니다. 2010년부터 서비스가 이뤄졌고, 데이터는 10년 동안 쌓아 왔습니다. 이미 카카오내비와 다음 검색에 활용될 정도로 완성되어 있습니다.”


음성 인식 기술은 목소리를 데이터로, 즉 글자 형태로 인식할 수 있는 기술입니다. 요즘의 음성 인식 기술은 단순한 받아쓰기가 아니라 명령을 내리는 목소리만 정확하게 듣는 것이 중요한 기술입니다. 그래서 잡음을 없애는 기술부터 정확도를 높이기 위한 인공지능 기술까지 더해집니다. 카카오의 과제는 ‘더 멀리’에 있습니다. 현재는 5미터 정도 안에서 소리를 들을 수 있는데, 이를 7미터 이상으로 늘리는 것이 목표입니다. 멀리 떨어진 소리를 듣는다는 것은 단순한 거리를 넘어, 더 작은 소리를 알아들을 수 있다는 것, 그리고 인공지능 기기의 ‘귀’가 들을 수 있는 범위가 넓어진다는 것으로 통합니다. 보이지 않게 기기를 곳곳에 숨겨서 생활에 더 밀접하게 만들겠다는 카카오미니의 출발점과도 통하는 겁니다.


시각 엔진도 중요한 기술입니다. 사진을 비롯해 글자 등을 읽고 그 안에서 정보를 파악하는 것이지요. 이미지의 내용을 읽을 수 있다는 것은 곧 사진이나 동영상을 글자로 검색할 수도 있고, 그 반대도 가능하죠. 이미 카카오에서는 꽃 검색을 비롯한 서비스에 적용됩니다.


대화엔진의 구조


대화 엔진은 음성 인식과 연결되는 기술입니다. 클로드는 ‘대화 매니저’ 기술을 가장 중요하다고 말합니다. 문맥을 읽어낼 수 있어야 한다는 것이지요. “오늘 날씨는 어때?”라고 물은 뒤에 “그럼 내일은?”이라는 불완전한 문장을 말해도 앞 뒤의 문맥을 다 합쳐서 파악하는 것이지요.


추천 엔진은 말 그대로 개개인의 취향과 관심사에 따라 콘텐츠를 추천해주는 개인화 서비스입니다. 음악을 비롯해 인공지능 서비스들에 자주 접목되는 기술들이지요. 번역 역시 인공지능 기술인 '딥러닝(Deep Learning)’로 급격하게 자리잡은 기술입니다.


중요한 것은 이 기술들이 단순히 카카오만의 것이 아니라 세상의 아이디어들과 함께 할 수 있도록 만들어지고 있다는 겁니다. 클로드는 카카오 I의 기술들이 더 많은 곳에 쓰이기를 바란다고 말합니다.



저희가 모든 서비스를 만들어낼 수는 없습니다. 

자동차나 아파트에 쓰이는 서비스는 각자의 전문성을 가진 기업들이 더 잘 알고 있습니다. 그들이 카카오 I를 이용해서 인공지능 기반의 서비스를 운영하고, 카카오가 이 인공지능 기술들을 업데이트하면 각 서비스들도 진화되는 것입니다.


카카오는 ‘툴’이라는 서비스도 제공합니다. 기업들이 자기 서비스에 카카오 I를 집어넣을 수 있습니다. 또한 올해는 오픈빌더라는 틀을 내놓을 계획인데, 이를 통해 어디에서든 카카오미니나 카카오톡 챗봇 등의 기술들이 자연스럽게 뿌리내릴 수 있습니다. 확장성과 생태계, 기업들이 가장 꿈꾸는 목표이기도 하지요.


“현재는 가정, 자동차, 스피커에 있는 인공지능 서비스가 모두 분리되어 있습니다. 하지만 이것들이 결국 하나로 통합되어야 할 겁니다. 당장은 쉽지 않을 수 있지만 결국 이용자 중심의 서비스가 만들어지려면 한 회사의 한 가지 서비스를 통할 수 밖에 없습니다. 그래서 쉽지는 않겠지만 기업들끼리 서로 플랫폼과 데이터를 통합할 수 있다면 가장 좋겠지요.”


클로드는 생활의 연결로 사용자들에게는 더 많은 이익이 돌아갈 것이라고 강조했습니다. 연결의 유익함, 카카오가 꿈꾸는 비전이기도 하지요. 라이언을, 스피커는 카카오가 그리는 하나의 ‘모양’일 뿐이라는 이야기입니다.



강연 풀버전 VOD 보기



글 : IT컬럼리스트 최호섭 (work.hs.choi@gmail.com)



클로드


본명은 김병학. 카카오의 AI 사업을 진두지휘하고 있는 AI 부문장이다. 생활에 밀접한 AI 서비스를 늘 고민하고 있다.


카카오스쿨 AI학기 목차

Intro
- 안녕! 카카오스쿨
- 인공지능과 함께 사는 방법, 사람다움

1주차. 사회 영역
- 인공지능 시대의 창의성 / 김영하 소설가
- AI 시대의 직업, 그리고 교육 / 라이언

2주차. 말하기 듣기 영역
- AI 시대, 언어를 알면 인간이 보인다 / 조승연 작가
- AI 시대에 컴퓨터와 대화하는 방법 / 조디악

3주차. 인간 생활 영역
- AI와 인간의 연결 / 김경일 교수
- AI와 생활의 연결 / 클로드

4주차. 미래 영역
- 영화속의 AI, 공존과 대결 / 김태훈
- AI로 할 수 있는 것들, 그리고 가능해질 것들 / 커티스

Outro
- 우리는 어떤 인공지능과 살아갈까
- 카카오스쿨 비긴즈


매거진의 이전글 AI와 인간의 연결 : 육감의 심리학

매거진 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari