올해는 구글이 너무 착했다.
안녕하세요. 디에디트에 첫 원고를 쓰는 IT 칼럼니스트 최호섭입니다. 지난 5월 7일부터 캘리포니아 마운틴뷰에서 열린 구글의 개발자 컨퍼런스 ‘구글I/O’에 다녀왔습니다. 구글I/O는 이제 개발자들을 위한 컨퍼런스를 넘어 구글을 이용하는 모두의 축제로 자리 잡고 있습니다. 유명 유튜버인 ‘박막례 할머니’도 참석하셔서 인사를 나누기도 했는데, 정말 좋은 분이었어요. 한국에서 만나기 어려운 개발자나 디자이너들을 해외에서 만나는 것도 특별한 재미입니다. 특히 행사장을 널찍한 야외로, 그러니까 쇼라인 앰피시어터로 잡은 뒤로는 더 축제 같기도 하고, 소풍 나온 것 같은 분위기도 물씬 풍깁니다.
개인적으로 구글I/O 현장에 이번이 세 번째 참가였지만 여전히 행사는 마음을 설레게도, 또 긴장하게도 합니다. 어떤 게 나올지 모르기 때문이지요. 하지만 온전히 기술을 두고 고민과 숙제를 공유하는 이 개발자 컨퍼런스의 현장은 언제라도 10시간 비행이 아깝지 않을 만큼 즐겁고, 또 많은 깨달음을 줍니다. 무엇보다 그 에너지를 얻어온다는 의미 때문에 1년 중 가장 기다리는 이벤트이기도 합니다.
올해 구글의 개발자 컨퍼런스는 그 어느 때보다 여러 가지 생각을 남겼습니다. 키노트 직후에 주변의 반응은 꽤 복잡하게 갈렸습니다. ‘새로울 것 없다’, ‘놀랄 만한 게 없었다’는 이야기가 적지 않았지요. 아마 ‘무난했다’ 정도가 많았던 것 같습니다.
구글I/O 현장의 분위기 때문인지 모르겠지만 키노트가 끝나고 자리에서 일어나면서 ‘구글이 정확히 방향성을 잡고 있다’는 느낌이 들었습니다. 그리고 그 밑바탕에는 ‘그 어느 때보다 기술이 빠르게 발전하기 때문’이라는 생각이 있었습니다. 기술이 가능했기에 상상하던 일들이 하나씩 일어나고 있는 것이지요. 다만 우리가 그 기술들을 접하는 앱이나 서비스가 너무 쉬워지면서 조금 시시해 보인다고 할까요.
이번 구글I/O에서 최고의 순간은 인도의 한 여성이 구글 고를 이용해 문맹을 벗어날 수 있게 된 사례를 보여주는 화면이었습니다. 문맹 때문에 은행 업무나 일상생활에서 겪는 불편함이 크고, 특히 아이를 키우면서 책을 읽어줄 수도 없고 학교 준비물을 챙겨주는 데에도 애를 먹는 일이 많았습니다. 하지만 스마트폰 카메라로 글자를 비추면 읽어주는 구글 고를 쓰면서 글자 때문에 문제를 겪는 일이 줄었습니다.
구글 고는 기술적으로 뜯어보면 아주 간단한 제품입니다. 카메라를 통해 들어오는 이미지에서 글자를 인식해서 읽어주거나 번역하는 기능이 전부입니다. 구글이 그동안 구글 렌즈나 번역 앱에서 써오던 기능들이지요. 따져보면 OCR, TTS 등 우리가 이미 잘 알고 있는 기술들이기도 합니다. 하지만 용도에 따라 기능을 단순화하고 일상생활의 ‘글자’와 마주치는 문제를 풀기 위해 기술을 묶는 것으로 새로운 가치를 만들어냅니다. ‘할 수 있는 것’과 ‘쉽게 할 수 있는 것’의 차이는 매우 큽니다.
프로젝트 유포니아도 비슷합니다. 구순 장애나 마비 등 말을 하기 어려운 장애인들의 목소리를 학습해 정확한 의사 표현을 전달해주는 서비스이지요. 음성 인식 머신러닝 기술은 3시간 정도 학습하는 것으로 대부분의 말을 알아들을 수 있습니다.
사실 완전히 새로운 기술은 아닙니다. 다만 기술을 어떻게 해석하느냐에 대한 방법이 달라진 것이지요. 물론 구글조차도 이제 기술이 정체되고 있는 것 아닌가 하는 해석이 나올 수도 있습니다. 스마트폰 이후의 세상은 놀라움의 연속이었고, 그 발전은 우리의 삶을 송두리째 바꾸어 놓았습니다. 더 빠른 프로세서, 더 큰 화면으로 새로운 경험을 하게 됐고, 구글의 서비스 하나하나가 흥미로웠습니다. 간혹 엉뚱하다는 느낌이 들 만큼 구글은 많은 시도를 했고 구글I/O의 키노트도 그만큼 재미있었지요. 구글이 아니면 못 할 것들이었으니까요.
구글은 안드로이드를 더 고도화했고, 구글 서비스는 머신러닝 프레임워크인 텐서플로(TensorFlow)를 더하면서 급격히 발전하기 시작했습니다. 하지만 우리의 스마트폰 이용 습관은 딱 그 순간 멈추고 말았습니다. 스마트폰에 깔아 쓰는 앱의 수는 늘어나지 않았고, 새로운 앱을 깔아보는 시도도 분명히 줄어들고 있습니다. 페이스북, 카카오톡, 유튜브 정도면 충분한 경우가 많습니다.
그런데 왜 키노트는 심심하다고 느껴졌을까요? 키노트에 원했던 것은 사실 기술이 아니라 ‘자극’이 아니었을까요. 구글은, 애플은, 마이크로소프트는 10년 전에 주었던 기술 기반의 충격, 그러니까 우리가 ‘혁신’이라고 받아들였던 그 경험을 만들어줄 것이라는 기대인 셈이지요.
지난해 구글I/O의 가장 큰 볼거리는 ‘듀플렉스(Duplex)’였습니다. 듀플렉스는 이용자가 원하는 시간에 음식점과 미용실을 예약해주는 서비스인데, 그 수단이 전화였습니다. 기계가 사람과 통화해 서비스를 예약하는 것이지요. 충격적이라는 반응이 많았습니다. 혁신적이었지요. 그런데 이 기술도 완전히 새로운 것은 아닙니다. 여느 예약 앱처럼 이용자에게 음식점, 예약 시간, 인원 등을 입력받고 이 정보를 바탕으로 전화를 걸어 사람과 대화를 하는 겁니다. 구글 어시스턴트가 늘 하던 것이지요. 목소리도 구글 어시스턴트의 그것이고, 대화를 주고받는 패턴도 비슷합니다. 앞서 이야기한 구글 고와 기술 활용의 맥락은 크게 다르지 않습니다. 구글이 갖고 있는 기술 중에서 예약에 맞는 서비스를 묶고, 고도화한 것이지요.
기술이 혁신적이었다기보다 그 경험이 놀라웠다는 편이 맞을 겁니다. 올해 구글I/O를 통해 구글이 하고자 하는 이야기는 크게 달라지지 않았습니다. 사람과 경험입니다. 기술은 발전하지만 사람들은 잘 이용하지 못합니다. 소득이나 기본 인터넷 인프라의 격차 그리고 기기의 차이는 기술과 사람 사이의 간극을 점점 벌여 놓았습니다. 한때 테크 기업들은 기술을 뽐내는 데 열을 올렸고, 대부분은 그럴싸해 보였습니다. 하지만 그 많은 기술들은 대부분 사장되는 경우가 많았습니다. 구글이 적지 않은 서비스들을 종료하는 이유 중 하나는 쓰는 사람들이 너무 한정됐다는 점입니다. 기술과 이용자 사이의 거리가 너무 멀어진 것이지요.
구글은 이를 잘 알고 있었을 겁니다. 그리고 머신러닝을 기점으로 구글은 서비스에 변화를 더합니다. 없던 무엇을 꺼내놓는 것이 아니라 기존의 기술을 가다듬는 것입니다. 머신러닝은 애초 서비스를 만들 때 의도했던 세밀한 것들을 풀어내는 데 가장 효과적인 도구였지요.
목소리를 인식할 수 있는 기능을 다르게 해석하면 장애인의 목소리를 알아들을 수 있게 됩니다. 카메라로 글자를 읽어야 하는 이유는 수천 가지가 있을 겁니다. 그리고 이를 가능하게 만드는 것은 결국 기술이 머신러닝을 통해 더 정교하게 발전하기 때문이지요.
그럼 구글의 기술 발전은 정체되고 있을까요? 그건 아닙니다. 어떻게 보면 그 어느 때보다 발전 속도가 빠릅니다. 느껴지는 온도 차가 있을 뿐이지요. 구글의 모든 서비스에는 머신러닝이 더해지고 있습니다. 머신러닝 기술은 한번 만들면 끝나는 것이 아니라 점점 더 진화하는 것이 특징이지요. 그게 처음 머신러닝 기술인 텐서플로를 발표했던 2015년 이후 몇 년 사이에 급격히 발전했고, 그 기술을 바탕으로 한 서비스와 제품들은 하드웨어와 소프트웨어를 가리지 않고 지속적으로 더 향상되고 있습니다.
예를 들어 번역 앱이나 음성인식 등을 보면 머신러닝 도입 이전과 이후는 전혀 다른 서비스이지요. 그러니까 사진을 읽고, 소리를 듣고, 원하는 것을 찾아주는 기술이 현실적인 수준으로 올라서면서 그동안 구글이 앱, 서비스를 통해 보여주려고 했던 상상력들이 제대로 표현되는 것이라고 볼 수 있습니다.
키노트에서 주목해야 할 부분은 구글이 기술을 사용하는 방법을 찾아가고 있다는 점입니다. 구글이 이번 키노트를 통해 꺼내놓은 비전은 ‘모두에게 도움이 되는 구글을 만드는 것’입니다. 기술의 본질은 사람에게 도움이 되는 것을 만드는 겁니다. 불편한 것들, 문제점, 어려움을 풀어내기 위해 기술이 만들어진다는 아주 간단한 본질에 대한 답이지요. 재미는 좀 떨어졌을지 몰라도, 기술은 이제 자연스러운 우리의 일부가 되었다는 반증일 지도 모릅니다.