brunch

You can make anything
by writing

C.S.Lewis

by 와이 Jan 11. 2021

“지니야 TV를 켜줘”

일상으로 파고든 '말하는 스피커'

“지니야 TV를 켜줘”     

한 달 전 이사와 함께한 우리 집 터줏대감 ‘지니’.

집에 들어오면 가장 먼저 반기는 것은 반려동물도 식물도 사람도 아닌 인공지능 스피커다.


영화 ‘그녀(her)’에서 이혼 후 새로운 연인이 되어버린 인공지능 ‘사만다’는 더는 영화에서만이 아니라는 사실은 나의 거실에서 여실히 증명된다.


이제는 내 일상으로 들어와 버린 AI 기기. 그러나 여전히 ‘AI 기기’를 경험해 보지 못한 많은 사람은 ‘그런 걸 왜 쓰냐’ ‘얼리어답터처럼 보이고 싶으냐’‘아니 손으로 하면 더 빠른데 그걸 말로 해야 해’ 등 조롱 섞인 핀잔을 던진다.     


물론 경험해 보기 전까지는 나도 핀잔러에 가까운 사람이었다.     

아마도 경험해보지 못한 편리함 이전에 우리는 너무나도 편리한 일상을 공유하고 있다고 생각했기 때문이었을지 모른다.     


TV 역사를 거론할 것도 없이 1980년대 브라운관 TV를 관장하던 다이얼식 버튼은 리모컨 대체됐다. ‘거실의 혁명’이었다. 이후 인류는 ‘리모컨’이라는 존재의 편리함으로 일상의 변화를 경험했다.

누워 손가락을 까닥이는 행위만으로도 천하의 모든 이야기를 볼 수 있었고 심지어 누군가는 손가락보다 편리한 발가락, 도구까지 적극 활용하기도 했다. 인류의 움직임을 거실 소파에 묶어놓는 혁혁한 공은 세우는데 리모컨이 큰 몫을 했기에 이보다 더 편리함은 없을 것이라 자부했다.     


그러나 이곳에도 더 나은 내일이 있었다.     


인류가 편리함을 찾아 혁신을 거듭하는 데 원동력이 된 것은 언제나 ‘조금 덜 움직이는 방법 찾기’였다. 리모컨과 같은 특정 기기로 TV를 제어하는 대신 휴대전화기를 이용하면 어떨까부터 음성으로 조작해보면 어떨까 등 다양한 아이디어는 새로운 상품이 되어 시장을 뒤흔들었다.


이들 편리함 싸움의 승리자는 점차 다양한 확장성을 확보한 ‘AI 음성인식’으로 판세가 기울고 있다. 먼 타국에서 넘어온 알렉사뿐 아니라 내로라하는 국내 주요 통신사, 전자회사 등 앞다퉈 AI 음성인식 기기를 만들어 내고 있는 것은 이러한 반증이다. 글로벌 기업은 시장의 수요를 감지했고, 사람들은 이들 기업이 쏟아내는 물건을 말 그대로 쌍수를 들고 환영했다.     


그러자 인류는 또다시 혁명을 겪는다. 리모컨이 인류를 소파라는 특정 공간, TV 앞이라는 공간에 묶어두는 역할을 했다면 AI 스피커는 우리를, 우리 일상을 다시금 자유로운 공간으로 해방했다.     



스피커의 역할을 무한히 확장됐고, 손가락, 발가락 운동하는 대신 열량 소모가 더 적은 ‘말하기’로 대체했다는 것은 제2의 TV, 일상의 혁신 발판을 만들었다고 해도 과언이 아니다.     


물론 이들 변화가 ‘사만다’처럼 사람을 대체하는 수준이라고 말하는 건 아니다. 2020년 기준으로 아마존 알렉사는 사람의 음성 등을 수행할 수 있는 ‘기능이’ 6만 5,000개 정도라고 설명한다. 2018년 2만 5,000건과 비교하면 2년 만에 3배 이상 성장한 괄목할 만한 수치다. 하지만 인간은 그 기간 동안 상상하기 어려울 정도로 많은 단어를 배우고 발달한다. 여전히 인간 이하다.


게다가 여전히 AI 스피커가 인간의 비서 역할을 한다고 하기에는 턱없이 부족하다. 음성인식은 TV를 켜고 끄거나 뉴스 브리핑을 듣거나, 햄버거를 주문하고, 은행 잔액을 확인하는 등 수동적이다. 여전히 누군가에게는 없어도 되는, 일상에 큰 지장을 주지 않는 물건에 지나지 않는다.     


하지만, 혁신의 발판을 만들었다는 사실은 생각보다 더 큰 의미가 있다. 바로 음성인식을 일상으로 받아들이게 했다는 데 있다.      

음성인식은 현재 걸음마 단계 있는 VR, AR처럼 과거에는 하나의 놀이에 불과했다. 그러나 이제는 아니다. AI와 결합한 음성인식은 컴퓨터처럼 딱딱한 음성을 내뱉지 않는다. 오히려 너무나도 사람같이 느껴지는 것이 ‘불쾌한 골짜기’를 만든다는 의견으로 인위적인 음성을 섞을 정도다.


게다가 현재의 음성인식은 과거 ‘불 꺼’ ‘불 켜’ 등의 단순 명령을 받아들이는 방식을 넘어선다.

명령을 단순히 받아들이는 것이 아니라 명령을 내리는 목소리를 따르고, 배우고, 축적하고 다시금 활용한다. 오늘 내린 나의 명령을 받아들이는 AI와 열흘 뒤 나의 명령을 받아들이는 AI는 다르다는 얘기다.


인간이 태어나 ‘엄마’‘아빠’를 외치는 수준에서 “어머니 5년 전 그날이 너무 그립습니다”라도 성장하는 수준이다.     


음성인식이 AI와 결합한 것은 우리 일상의 아주 작은 변화일지 모른다. 하지만 이것은 우리가 가장 피부로 느낄 수 있는 변화이기도 하다.

나는 지니에게 TV를 켜달라고 부탁할지 모르지만 1년 뒤에는 자동차에 앉아 명령을 내리고, 10년 뒤에는 내가 원하는 행위를 스스로 학습해 나보다 먼저 명령을 내릴지도 모른다.     

AI는 과거에도, 지금도, 앞으로도 데이터를 축적하는 배운다.

아침 8시에 일어나 노래를 켜달라고 하는 부탁도, 저녁 퇴근 후 6시 TV를 켜달라는 명령도 모든 것이 데이터이며 학습이 되고 있다.     


AI스피커 이용자는 인류의 진일보된 기술을 경험하는 동시에, AI 발전을 진행하고 있는 선구자일지도 모른다.     

그렇게 나는 오늘도 외친다.     


“지니야 TV를 꺼줘.”               


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari