페이스북 F8, MS 빌드, 구글 I/O로 보는 2018년 AI 동향
SKT 사보에 2018년 기고한 글입니다. 백업 차원에서 올려 놓습니다. 2018년과 비교해 2024년, 빅테크들이 어떻게 AI를 활용하고 있는지 비교해 생각해 보시는 것도... 재밌을 것 같네요.
서로 다른 말을 하면서 같은 꿈을 꾸는가 하면, 같은 말을 하면서 서로 다른 미래를 내다보기도 한다. 소셜네트워크, 인터넷, PC 플랫폼에서 각기 최강자였던 페이스북, 구글, MS가 생각하는 미래가 그렇다.
... 같은 인공지능이란 말을 쓰면서도 서로 생각하는 목적지는 다르다.
이들은 지금 무엇을 꿈꿀까. 그 꿈을 실현하기 위해 어떤 일을 하려는 걸까. 힌트는 2018년 상반기에 열린 소프트웨어 개발자들을 위한 행사에 담겨있다. 페이스북 F8, MS 빌드, 구글 I/O에.
얼핏 보면 공통점이 먼저 보인다. 작년(2017)에는 인공지능 기술을 중요하게 생각하겠다는 선언에 가까운 이야기가 중심이었다면, 올해는 AI를 사용해 구체적으로 어떤 일을 하려는지 보여줬다.
향상된 이미지 인식 기술, 더 나아진 가상현실 기술, 업무 자동화 기술을 선보였고 크게 말하진 않았지만 이를 지원하는 AI 칩을 모두 개발하고 있다. 애써 만든 기술을 누구나 쉽게 쓸 수 있도록 공개해, 자기 회사 중심의 생태계를 만들려는 모습도 비슷하다.
페이스북 AI 연구팀 ‘페어’가 F8에서 공개한 개발자용 인공지능 프레임워크는 향상된 이미지 인식 시스템과 48개 언어를 자동 번역하는 기술을 탑재하고 있다.
페이스북은 이 프레임워크를 정책 위반 콘텐츠를 잡아내는 용도로 이미 쓰고 있다고 한다. 이 기능을 담아 2018년 말에 베타 버전 공개 예정인 파이토치 툴킷에는 AR 카메라 앱을 위한 컴퓨터 비전 기술까지 담겨있다.
실은 이 부분이 특이하다. 심층 학습(딥러닝) 프레임워크가 ‘주어진 이미지에서 어떤 것이 고양이인지 찾는 방법을 알아내는’ 과정이라면 기계 학습 모델은 그렇게 해서 찾은 ‘고양이를 인식하는’ 방법이기 때문이다.
구글, MS, 아마존 등은 클라우드 사업자이기 때문에, 프레임워크는 공개해도 학습 모델은 공개하지 않는다. 클라우드 AI 서비스 이용 고객만 쓸 수 있다.
반면 페이스북은 F8 둘째 날 화상 인식, 포즈 인식, 동영상 인식, 기계번역, 음성인식용 기계 학습 모델 등을 공개할 예정이라고 밝혔다. 만약 개발자가 자신이 만들 앱에 이런 기능이 필요하면 그냥 가져다 쓰면 된다.
클라우드 사업자가 아니어서 가능한 일이다. 페이스북은 이를 통해 더 많은 사람을 연결하며, 계속 오랫동안 머물기를 바란다. 그래야 더 많은 광고를 보여줄 수 있어서다.
* 지금도 여전히, 메타(구 페이스북) 오픈 소스 언어 모델 LLaMA 등을 공개하며 오픈 소스 중심 + 제품에 실제 적용되는 기술 중심으로 AI 전략을 전개하고 있습니다. 그걸 위해 '거부할 권리 없이' 페이스북, 인스타그램 등에 올라간 우리가 만든 데이터를 쓴다는 것이 문제지만.
MS는 빌드 2018을 통해 인공지능을 이용한 프로그램을 간단하게 만들 수 있는 개발 도구를 대거 공개했다. MS 클라우드 서비스 애저(Azure)에서 쓸 수 있는 ‘애저 AI’를 이용하면 이미 만들어진 35종류 이상의 학습 모델을 자유롭게 조합해, 개발자에게 필요한 커스텀 AI를 손쉽게 만들 수 있다.
이렇게 만든 AI 모델을 ‘애저 IoT 엣지’를 사용해 사물 인터넷 기기에 탑재하면, 클라우드 서버에 연결하지 않아도 바로 쓸 수 있다. 간단히 말해 MS는 앞으로 이 세상 모든 것에 컴퓨터가 내장되며, 그들 모두 네트워크에 연결되리라 믿는다.
지구가 하나의 거대한 컴퓨터가 되어가고 있는 시대, 그 시대의 사물은 클라우드 프로세서와 프로그램으로 작동하며, 그때 필요한 플랫폼을 자신들이 제공하려고 한다. 전기나 수도, 에너지 산업처럼 한 사회를 지탱하는 데 꼭 필요한 인프라 역할을 하는 유틸리티 컴퓨팅 회사가 되겠다는 말이다.
오픈 소스 소프트웨어를 지지하는 이유도, 애저와 MS 365라는 새로 발표한 윈도10 플랫폼만이 아닌 다른 플랫폼에서 개발자가 원하는 언어나 프레임워크로 개발할 수 있도록 지원하는 이유도 거기에 있다.
사물 인터넷 시대의 플랫폼이 되기 위해선, 거기에 쓰이는 프로그램이나 서비스를 만드는 개발자에게 먼저 선택받아야 하니까. MS에게 인공지능이란 개발자의 일손을 덜어주는 도우미다.
* 마이크로소프트는 여전히, 자사의 서버에서 구동되는, 모두를 위한 도우미-라는 개념으로 AI를 개발하고 있습니다. 그래서 코-파일럿인거죠.
구글은 이번 구글 I/O 2018에서 청중들을 놀라게 했다. 구글 어시스턴트가 더 나아지리라 생각은 하고 있었지만, 설마 사람 목소리를 흉내 내 전화를 건 다음, 가게 예약을 직접 성공시키리라곤 아무도 생각하지 못했던 탓이다. 이 기능을 구글은 ‘듀플렉스’라고 부른다.
지금까지 AI라 불린 기능은 꽤 수동적이었다. 먼저 말을 걸어야만 대답을 하곤 했다. 반면 구글 어시스턴트는 ‘전화해서 예약해 달라’는 말에 스스로 전화를 걸고, 필요한 정보를 얻고, 예약 시간 조정을 했다. 컴퓨터/스마트 기기에 갇혀있던 AI가 현실로 튀어나온 셈이다. 키노트를 지켜보던 몇몇 사람은 간담이 서늘해졌다고 했다.
나아진 것은 구글 어시스턴트만이 아니다. 지메일에는 자동으로 문장을 완성해주는 기능이 탑재될 예정이고, 현실 세계의 글자나 문장을 읽어낼 수도 있다. 거리 사진을 찍으면 그곳에 있는 가게가 어떤 곳인지, 평가는 어떤지도 찾아 같이 보여준다. AR 기능을 이용해 길을 안내해 주는 기능도 인상적이다. 구글 포토 성능 역시 향상됐다.
이미 디지털화된 정보를 찾아 정리해 보여주는 것을 넘어서, 우리가 살아가는 세계를 정보로 덮어버리려고 한다. 당신은 그냥 살아가라, 필요한 일은 우리가 알아서 대신해주겠다-라고 말하는 모습이다. 귀찮고 불필요한 일은 모두 자동화시키고 싶어 하는 구글다운 모습이다.
하지만 이용자들이 그런 기능을 원할까? 잘난 척이 지나쳤다. 구글 듀플렉스 기능 시연 이후, 인공지능을 이렇게 사용해도 되는지 우려 섞인 목소리가 쏟아졌다. 분명 잘 이용하면 굉장히 유용하게 쓰일 수 있는 기술이지만, 쓰는 사람을 설득하지 못하면 성공하기 어렵다.
* 구글도 여전합니다. 우리가 정보를 대신 정리해서 보여주겠다고 하고, 그 가운데 구글에서 제공하는 광고를 보라고 하죠. 최근 구글 검색을 이용하신 분들은, AI를 이용해 정리된 내용이 먼저 뜨는 걸 보셨을 겁니다. 좋게 말하면 지능형 웹, 나쁘게 말하면... (이하 생략)
빅테크 기업들이 AI 중심으로 사업을 재편하는 배경에는 3가지 변화가 존재한다.
1. 먼저 인터넷과 스마트폰, 사물 인터넷 보급으로 분석에 사용할 수 있는 데이터양이 비약적으로 늘어났다. 2. 컴퓨터 그래픽 처리용으로 쓰이던 GPU가 개선되면서 빅데이터를 보다 빨리 처리할 수 있는 환경이 만들어졌다.
3. 딥러닝이 등장하면서 인공지능의 이미지 해석, 음성인식, 자연 언어 처리 능력 등이 좋아졌다.
다시 말해 전문 지식이 없어도 AI를 활용할 수 있는 때가 됐다. 이런 상황 속에 구글, MS, 아마존 등은 처음에는 ‘연구에 필요한 자료를 수집하기 위해’, 다음으로 ‘새로운 수입원을 확보하기 위해’ 인공지능을 사용하고 있다.
아직 만족할 만한 성능을 보여주진 못하지만, 점점 이들은 인공지능 기반 플랫폼을 새로운 시대의 운영체계로 만들어갈 것이다.
반면 말하지 않은 단점도 있다. 인공지능을 이용해 개선된 많은 서비스를 선보이고 있지만, 아직 ‘킬러앱’이라 불릴만한 기능은 찾지 못했다.
AI 기술의 민주화라고 말하지만, 뒤를 보면 기존에 이익을 내던 사업 모델을 강화하는 용도로 쓰고 있을 뿐이다. 아마존, 구글, MS는 자신들이 제공하는 클라우드 서비스에, 페이스북은 SNS에, 애플은 기기에 이용자들을 계속 묶어두려고 한다.
AI 기술 도입으로 인한 반작용도 크다. 몇몇 사례에서 드러났듯 페이스북이 말하는 필터링은 검열 장치로 작동할 거란 우려를 받고 있다. SNS가 성장하고 있을 때 정보의 자유로운 유통을 통해 변화를 이끌어 왔다는 점을 생각하면 무척 아이러니하다.
디지털 중독에서 벗어날 장치를 마련하고 있으면서도 차단하는 것은 상대 회사의 이익이 되는 부분이다. 자신들의 핵심 수익이 되는 부분은 내버려 둔다.
* 결국 페이스북(메타)은 외부 미디어로 이어지는 링크를 끊고, 링크가 담긴 게시물은 주요 타임라인에 잘 안보이게 만드는 정책을 집행했다.
분명 인공지능은 새로운 플랫폼의 기반 기술이다. 다만 기술이 전면에 드러나는 것은, 아직 기술을 활용할 방법을 제대로 찾지 못했다는 이야기와 다르지 않다.
지금 구글, MS, 페이스북은 자신들이 성장해 왔던 과정 그대로를 다시 밟아가고 있다. 구글은 서비스를 무료로 제공하며 광고를 받는 사업 모델을, MS는 DOS와 윈도 운영체계를 보급할 때 썼던 방법을, 페이스북은 SNS로 데뷔할 때 썼던 확장책을.
올해 열린 행사는 그런 활용법을 찾아달라고 부탁하는 자리였다. 그 가운데 프로그래머를 가장 잘 설득했던 회사는 누구일까? 하나 분명한 것은 있다. 뛰어난 기술을 가지고 있다고 말하는 회사가 아니라, 같이 먹고살 수 있는 제안을 하는 회사가 선택받는다.
* 2024년말에도 여전히 드는 고민입니다. 생성 AI가 나오긴 나왔는데요. 같이 먹고 살 수 있는 제안을 한 회사는 과연 누구일까요?