brunch

매거진 OTT론

You can make anything
by writing

C.S.Lewis

by JSL Jan 12. 2023

청각 미디어의 디지털화와 그 인터페이스

1. 서론: 디지털 미디어, 인터페이스의 문제     


1) 디지털 전환, 라디오에서 청각 미디어로

영화, 텔레비전, VCR에 이어 HD, 3D, UHD, 그에 걸맞은 5.1채널 음향 등 화려한 영상 콘텐츠가 거실에서, 개인 휴대 단말기에서, 거리 곳곳에서 경험된다. SNS와 포털, OTT 또한 어떤 콘텐츠 형식이든 보기(seeing)를 위한 미디어이다. 현대사회에서 주력 미디어는 현실을 닮은 개연성있는 이야기를 콘텐츠로 하는 ‘가시성의 미디어’(visible media)이다(Ellis, 1982). 초기 라디오에 이어 디지털 라디오 앱, 팟캐스트, 오디오북, AI 스피커 등 비가시적인 청각 미디어(auditory media)마저 그래픽이용자인터페이스(GUI)에 힘입어 가시성의 영역으로 탈바꿈하고 있다. 세계를 파악함에 있어 사람들의 모든 주의와 감각을 시각적 보기로 수렴시키는 시각 중심주의가 미디어 산업과 서사 미학의 전부가 되어버린 듯하다. 


이제 비시각성의 미디어는 소멸의 수순을 밟을 것인가? 그래픽이용자인터페이스가 컴퓨터(미디어)의 사용성을 고도화시키긴 했지만, 인간의 감각을 시각에 과잉의존시킴으로써 그렇지 않은 소리 미디어를 왜소하게 만든 면도 있다. 대표적인 소리 미디어인 라디오는 디지털화 과정에서 ‘구원’이 필요한 처지가 되어버렸다(Johnson, 2016). 애초에 라디오도 디지털 라디오 방송(DAB)의 비전이 있었다. 하지만 디지털 라디오의 꿈은 압축 기술의 발달로 DAB가 디지털멀티미디어방송(DMB)으로 바뀌면서 좌절되었다. 이제 라디오는 온라인 정보서비스(information service)의 하나인 ‘청각 플랫폼’에 포위되어 버린 듯 보인다. 팟캐스트, 오디오북 등 태생부터 디지털 기술과 플랫폼 사업모델로 시작한 청각 플랫폼이 소리 미디어 시장을 주도하고, 대화형 AI 스피커가 새로운 시장을 개척하면서, 소리 미디어의 진화는 비라디오 계열의 디지털 기술이 주도하는 형국이다. 


그런 만큼 디지털 전환 이후 기존의 라디오와 청각 플랫폼을 아우르는 ‘청각 미디어’ 고유의 영역을 생각해 볼 수 있다. 현실적으로나 상상으로나, 그것은 청각 정보를 토대로 일상생활의 여러 활동에 스며든 미디어일 것이다. 몇몇 채널로 국한된 라디오와 달리 청각 미디어에서는 듣는 것을 넘어 시각적이고 촉각적인, 심지어 청각적인 인터페이스를 통해 정보를 탐색하고 사회적 담론에 참여하며 정보와 지식과 오락을 넘나들 수 있다. 귓속의 청각 정보는 시각 정보에 비해 훨씬 개인친화적이다. 더욱이 청각 미디어는 가정 또는 사회생활 곳곳에서 어떤 일과 동시병행적으로 소비될 수 있다. 인공지능 스피커의 말하기/듣기 인터페이스와 블루투스, 무선 이어폰 등은 미디어 활동의 외연을 획기적으로 넓히고 있다. 최근 국내외에 발표된 획기적인 생성적 AI(generative AI) 채팅 시스템 또한 마찬가지이다. 그런 채팅은 인공 목소리로 재현될 수 있다. 뿐만 아니라 이용자 편의를 위해 인공적으로 생성한 소리(generative audio)가 음악은 물론 교통, 쇼핑몰, 가정 등에서 활용될 수 있다. 고연령층에게 청각 미디어는 더욱 절실하다. 청각은 시각 정보에 비해 짧은 시간에 응답되는 신속한 탐색, 사이렌이나 버저와 같은 직접적인 경고, 여러 종류의 소리 또는 외부자극을 동시에 처리할 수 있는 멀티태스킹, (목)소리 자체로부터의 미묘한 정보 파악, 시각적 피로로부터의 탈피 등 그 자체로서 충분한 가치를 지닌 정보 형식이다. 


팟캐스트팟캐스트로부터 시작한 청각 플랫폼은 수동적인 소리 미디어를 참여형의 청각 미디어로 탈바꿈시켰다.


청각 미디어는 21세기 전자 미디어가 소프트웨어로 재정의되는 가운데(Manovich, 2013) 라디오를 정체성 위기로 몰아가며 등장한, 매체사적으로 과학적 체계적 탐구가 필요한 영역이다. 소프트웨어로 정의되는 미디어는 채널을 바꾸고 소리를 조절하는 미디어 장치가 개별 미디어 고유의 물성을 따르지 않고 시각적이고 촉각적인 터치와 진동의 가상 인터페이스로 바뀌었다. 청각 미디어는 다른 무엇보다 기존의 라디오 존재양식을 기반부터 흔들어 놓았다. OTT에서 보듯이 텔레비전도 소프트웨어/AI로 이전하지만, 그것을 구현하는 전통적인 수상기, 리모콘, 스마트폰 화면 등 텔레비전 고유의 물성은 여전히 유지되고 있다. 그에 반해 청각 미디어는 온라인 플랫폼은 물론 라디오 애플리케이션조차도 각종 스피커 류를 제외하면 라디오 고유한 물성을 찾을 길 없다. 라디오 방송 이래 한 세기 동안 유지되어 온 통신의 관습(대표적으로 주파수와 호출부호의 표기와 호명)마저 청각 미디어에서는 보이지 않는다. 


이른바 ‘보이는 라디오’는 라디오의 소리와 듣기에 시각적이고 촉각적인 자원을 재매개한다. ‘보이는 라디오’는 “텍스트, 이미지, 사운드 등으로 구성된 텍스트가 단일한 인터페이스를 통해 제시되어 다양한 감각기관에 다중적으로 소구”되는 멀티미디어이다(이재현, 2007, 73쪽). 즉, 라디오는 디지털 가상세계와 인터넷의 재매개로 비디오와 텍스트 정보를 가미함으로써 청각에서 시각, 심지어 촉각적 경험을 제공하는 다중감각의 미디어로 변신했다. 라디오 부스 안에서 생산되던 전형적인 청각 콘텐츠는 점점 더 많이 시각적인 작법을 요구하고 미디어의 작동과 실행도 터치와 클릭 같은 촉각적인 감각의 사용을 요구한다. 팟캐스트나 팟빵 같은 청각 플랫폼은 연속 또는 단절적인 스레드, 셀프 편성, 검색, 타임라인, 링크 등을 통해 시각적이고 촉각적인 인터페이스를 제공할 뿐 아니라 자체 채널, 유튜브 등과의 동시방송이나 클립방송으로 시각적 콘텐츠로 확장해 간다. 


청각 미디어의 진화에는 ‘음성이용자인터페이스’(VUI; voice user interface)라는 보다 혁신적인 커뮤니케이션 영역도 있다. 빅데이터에 기반해 사람과 ‘대화’하는 이 새로운 미디어는 시각적인 배열로 제공되는 OTT의 자동추천과 비교해 ‘인공지능 스피커’, ‘대화형 에이전트’, 또는 ‘AI 미디어’라 불린다(박수아·최세정, 2018; 김정현·최준호 2018; 임종수·최진호·이혜민, 2020; 임종수, 2018). VUI는 기계적 시스템과 이용자 간에 음성을 통해 상호작용하는 것으로 “인간이 말한 내용을 시스템이 ‘이해’할 수 있도록 이용자의 음성 입력을 캡처하고 해독할 수 있는 능력에 의존한다”(Hura, 2008, p.197). 자동화된 대화(automated conversation)의 수준과 만족도가 VUI의 척도이다. 이는 청각 미디어가 예의 ‘듣기 미디어’에서 ‘말하기/듣기 미디어’로 확장되고 있음을 의미한다. 사람과 ‘대화하는’ 인터페이스로 말미암아 청각 미디어는 기존의 라디오를 넘어 각종 음원 서비스나 오디오북은 물론, 커넥티드 홈이나 커넥티드 카 등 범용 AI 시스템으로 확장할 수 있는 기반을 마련했다. 어쩌면 그런 시스템과 미디어 간에는 간극이 없을지도 모른다. 더욱이 무선 이어폰은 일상적 삶 속에서 청각 미디어 또는 그 시스템의 사용성(usability)을 극적으로 확장했다. 


라디오에서 청각 미디어로 통합되는 이같은 과정을 볼 때, 청각 미디어는 희귀한 제품(goods)보다 플랫폼에 참여하는 사람들의 집단지성이 만들어내는 서비스(service)를 커뮤니케이션의 주요 자원으로 삼는 것으로 분류된다. 경제학에서는 이를 제품중심논리(GDL, goods-dominant logic)가 아닌 서비스중심논리(SDL, service-dominant logic)로 설명한다(Vargo & Lusch, 2004). 전자가 노동과 토지, 자본과 같은 정태적인 수동자원(operand resource)으로 만든 희귀 제품의 교환가치로 서비스를 제공한다면, 후자는 대중의 지식, 생각, 기술, 역량 등 동태적인 능동자원(operant resource)을 토대로 만든 아이디어로 서비스를 창출한다. 기존의 지상파나 유료방송 채널과 달리, 동영상 OTT, 청각 미디어, 인공지능 스피커 등은 모두 정도의 차이가 있을지언정, 대중의 참여를 통해 추천과 편성의 인터페이스를 결정한다(Hirschmeier & Beule, 2021 참조). 특히 희귀 제품이 여전히 중요한 동영상 OTT에 비해 갖가지 청각 미디어류는 참여라는 능동자원이 콘텐츠 제작과 인터페이스 구성에 보다 중요하다.      


2) ‘관심사’라는 청각 미디어 인터페이스

살펴본 바와 같이 지금까지 미디어는 디지털 전환과 함께 채널을 플랫폼화하고 가시성을 강화해 왔다. 전래의 채널-미디어와 달리 플랫폼-미디어에서는 콘텐츠 또는 참여 데이터가 미디어 성패의 주요 요인이 되었고, 어떤 미디어 형식이든 이용자의 시각적 인터페이스가 중요해졌다는 것이다. 이에 청각 미디어는 콘텐츠와 이용자 데이터를 토대로 가시성의 인터페이스를 확보하면서도, 청각 고유의 인터페이스도 동시에 개척해야 하는 이중의 도전에 직면해 있다. 그런 인터페이스 구축의 한 가운데에 이용자의 ‘관심사’(interests)라는 정신적 속성(quality)이 있다. 그것은 ‘미학적 취향’(aesthetic tastes)을 속성으로 하는 넷플릭스 같은 동영상 OTT와 구별된다. 속성은 개체(individual)의 참여와 되먹임(feedback)을 기반으로 하는 계(system)의 독자적인 자동생산체계(autopoiesis)에서 발현되는 정신적 요소이다(Hayles, 1999; Penrose, 1989/1996). 청각 미디어의 영역이 다른 영역과 다르다면, 그것은 디지털 미디어의 알고리즘이 연산의 목적으로 삼는 속성이 서로 다르기 때문이다. 


그것이 청각이든 시각이든 플랫폼-미디어에서 속성은 디지털 이후의 ‘복잡계 미디어’(complexity media)를 해명하는데 있어 매우 중요한 개념이다. 복잡계는 “상호작용하는 개체들의 집합에서 창발이 일어나는 세계”를 일컫는다(Johnson, 2007/2015, 18쪽). 복잡계는 계를 구성하는 알고리즘이 개체와 개체 간의 상호작용인 매개변수(parameter)를 연산하여 얻은 고유한 값으로부터 어떤 속성을 정의내리는 체계이다. 예측적이기보다 설명적이고 실재론적이기보다 도구적이며 환원론이 아닌 전체론의 모델을 지향하는 ‘새로운 종류의 과학’이다(Downey, 2012/2016). 그렇게 볼 때, 복잡계 미디어는 미디어가 개체의 일방적 힘과 영향력으로 존재하는 것이 아니라, 플랫폼에 참여하는 개체들의 상호작용으로 말미암아 특정한 문화적 힘, 즉 계의 어떤 속성을 실현하는 미디어를 말한다. 복잡계 미디어의 인터페이스와 그 결과는 신문과 방송, 방송 중에서 공영방송이나 상업방송과 같이 개체의 제도적 기능과 효과로 파악되는 것이 아니라, 이용자와의 상호작용을 통해 미디어 고유의 속성이 작동, 실행, 수용되는 자기 조직적(self-organization)이며 창발적인 과정이라는 것이다. 이 시대의 미디어를 복잡계 시각으로 바라볼 수 있는 것은 플랫폼-미디어가 복잡계 네트워크로 디자인되어 사회적 원자(social atom)로 관찰 가능해짐에 따라(Buchanan, 2007/2010), 그 작동과 실행, 수용 방식이 복잡계 이론 또는 시각으로 설명가능하기 때문이다(박근서, 2012; 안민호, 2009 참고). 문화이론가 존 어리(Urry, 2005)는 2000년대를 1970년대의 맑시즘, 1980년대의 포스트모더니즘, 1990년대 글로벌 문화로의 분기 이후 나타난 ‘복잡성으로의 분기’(complexity turn)로 진단한 바 있다. 


정신적 속성으로서 미학적 취향과 관심사는 일정 부문 겹쳐 보이지만 구분 가능하다. 취향이 특정 대상물에 대한 개개인의 관심과 태도, 수용의 차이라고 할 때(Bourdieu, 1979/1995), 미학적 취향이란 장르, 배경, 분위기, 인물, 서사적 전개, 스타일(흔히 A급 또는 B급 문화라 불리는), 즐거움 등에 대한 차이를 일컫는다. 미디어 서사물(narratives)에서 주로 발현된다. 관심사는 주제나 소재, 진행자 또는 패널, 필요성, 이데올로기, 효능감 등과 같이 개인의 현재적 필요에 호응하는 정신적 심리적 측면을 뜻한다. 전래의 뉴스나 토론, 교육, 취미, 지식, 노하우, 솔루션 등은 관심사의 영역이다. 전자가 서사적 즐거움을 지향한다면, 후자는 지금 여기 현재의 필요에 부응한다. 넷플릭스가 넷플릭스 양자이론(NQT, Netflix Quantum Theory) 알고리즘을 위해 콘텐츠를 약 8만여개의 장르로 세분화한 것은 수용자 개개인의 미학적 취향을 데이터화하여 취향의 차이를 알고자 했기 때문이다(Lim, 2017). 대표적인 청각 미디어인 팟빵은 당대의 정치문화적 이슈, 세대별, 젠더별 관심사를, 인공지능 스피커는 미학적 취향인 음악 외에 날씨, 뉴스, 주식, 주문 등 지금 현재의 관심사를 실현한다. 전자의 콘텐츠가 현실과 동떨어져 있다고 할 수 없고, 후자의 콘텐츠 역시 미학적 수준을 고려하지 않는 것이 아닐지라도 지향하는 바는 분명 다르다. 


플랫폼-미디어의 인터페이스는 기본적으로 이같은 속성의 실현체이다. 원래 인터페이스는 물질 간의 화학작용에서 ‘접점’ 또는 ‘경계’를 일컫는 용어였다. 널리 알려진 것처럼, 이 용어는 컴퓨터 공학에서 많이 쓰이는데, 컴퓨터 연결장치 상태, 즉 연결장치를 통해 일어나는 상호작용의 조건 또는 방식을 의미한다. 인간의 관점에서 상호작용(interaction)이 두 시스템 사이에서 벌어지는 일련의 활동이라면, 인터페이스는 그런 상호작용이 일어나는 문화적 접점이다(이재현, 2003 참조). 따라서 접점을 어떻게 디자인하는가에 따라 상호작용이 달라질 수 있다. 그렇게 보면, 미디어 인터페이스는 인간과 미디어 간에 벌어지는 세 종류의 문화적 접점, 즉 1) 미디어 작동방식, 2) 미디어 실행방식, 3) 미디어 수용방식의 측면으로 고찰될 수 있다. 작동방식은 미디어가 작동하기 위한 기계적 장치의 운용을, 실행방식은 미디어가 인간에게 서비스하는 고유의 수행성을, 수용방식은 미디어의 실행과 작동의 결과로서 인간이 미디어를 소비하는 양상을 뜻한다. 가령 텔레비전은 채널과 볼륨 등 기계장치의 작동을 통해 특정한 시공간 안에서 프로그램이 실행됨으로써 당대의 특별한 문화적 수용상태를 낳는다. OTT는 콘텐츠를 추천하는 공간편성을 제공하여 몰아보기 또는 그 외의 다양한 시청행동을 통해 미학적 취향 문화를 낳는다. 


이 글은 청각 미디어의 디지털화와 그 인터페이스에 대해 탐색하는 시론이다. 이를 위해 논의의 실마리로서 미디어 인터페이스 개념을 앞세워 먼저 라디오로부터 시작한 청각 미디어의 역사를 살펴본다. 이는 라디오의 역사적 계보로부터 청취(자)가 갖는 청각 미디어 고유의 인터페이스 지평을 도출하는 작업이다. 이를 통해 소리의 시대가 어떻게 침묵으로 미끄러져 갔는지, 그럼에도 청각적 인터페이스가 그 어느 때보다 넓게 확장하는지 청각 미디어 인터페이스 양태에 대한 맥락적 이해를 제공할 것이다. 이 작업은 청각 미디어 인터페이스의 실질적 작용과 인공지능 스피커, 비미디어 계열의 청각적 인터페이스 탐구를 통해 밝혀질 것이다. 생성적 AI의 기술발전은 인간과 기계간의 대화수준을 한 차원 더 높혀준다. 미디어 철학자 맥루언을 포함해 주요 미디어 이론은 이런 논의를 펼치는데 도움이 될 것이다. 반세기 훨씬 전 “모든 것이 미디어”라는 맥루언의 통찰이 생소하지만 의미있게 적용되는 분야가 청각 미디어라는 것이 발견되기를 기대한다. 


미디어 인터페이스가 디지털 뉴미디어 방식(Manovich, 2001)으로 통합되는 지금 청각 미디어의 작동방식과 실행방식, 수용방식을 고찰하는 것은 유용한 작업이다. 청각 미디어 인터페이스 연구는 시각 미디어의 홍수 속에서 청각이라는 특별한 감각을 미디어 양식의 유의미한 자원으로 정립하는 일이다. 하지만 기본적으로 이 작업은 시각 미디어를 포함한 디지털 미디어 일반의 인터페이스 현상으로부터 청각 미디어의 ‘차이’를 탐구하는 일이다. 그러니까 시각 또는 청각과 무관하게 플랫폼-미디어의 존재양식 자체를 해명하는 시도 안에 청각 미디어의 디지털화와 그 인터페이스 탐구가 있다. 글의 제목을 ‘디지털 미디어 시론’이라고 한 이유다. 앞서 언급한 것처럼, 플랫폼-미디어는 개체의 제도적 기능을 중심으로 작동하던 대중매체와 달리, 각기 다른 인간의 참여를 통해 시시각각 변하는 정신적 속성을 인터페이스 자원으로 삼는다. 이는 익숙해 보이지만 실마리 잡기 쉽지 않다. 그럼에도 늘 우리의 상상력을 자극한다. 디지털 기술은 청각 미디어를 어떻게 바꾸고 있는가? 채널-미디어와 다른 플랫폼-미디어가 나름의 공통문화를 생성해 낼 수 있는 토대는 무엇인가?      


2. 청각 미디어 청취(자)의 계보: ‘소리의 시대’에서 ‘침묵의 시대’로     


현대인은 국민, 시민, 유권자, 소비자 외에 독자, 청취자, 시청자, 이용자 등으로 이어지는 미디어 수용자의 지위를 포함한다(임종수, 2010). 1927년 이 땅에서 처음 시작한 라디오는 인공적인 소리의 시대를 개막함과 동시에 근대적 활동으로서 ‘청취’, 인간존재의 한 방식으로서 ‘청취자’라는 자리를 구성해냈다. 청취(자)의 상태는 시기별로 달랐는데, 크게 보면 그 방향은 어떤 집단, 거리의 군중, 가족 등 ‘집단 청취(자)’에서 개별적인 ‘개인 청취(자)’로 전환했다(임종수, 2010; 김영희, 2002 참조). 집단 청취는 일제 강점기에서 한국전쟁 재건기까지 주로 성행한 바, 그 형태로는 거리 청취, 공공장소 청취, 이웃 청취 등이 있었다. 무엇보다 라디오는 비슷한 시기에 도입된 유성기가 그랬던 것처럼(이상길, 2001) 일찍부터 사적공간에서 소비되는 가족 청취가 주류였다. 라디오 집단 청취는 비슷한 시기 신문잡지 회람과 병행하는 것으로 훗날 초기 텔레비전에서의 거리 시청, 가족 시청의 전례라 할 수 있다. 


초기 라디오는 전력 사정과 경제적 여력이 좋지 않아 소수의 사람들이 향유하거나, 그 소리를 어떻게든 많은 사람들과 함께 듣고자 애써야 했던 신문물이었다. 값비싼 “확청기”(나팔 모양의 증폭기, 현재의 스피커) 라디오보다 “수화기”가 달린 광석식 라디오(crystal radio)가 접근성이 더 나았기 때문이다(서재길, 2006). 광석식 라디오는 광석(鑛石), 즉 광물 결정체로 만들어진 광석 검파기(crystal detector, 현대기술에서 다이오드)를 이용해 수신해 들어오는 높은 주파수의 전자파를 오디오 신호로 바꾸는 장치였다. 따라서 수신된 소리는 전화 수화기처럼 한 사람이 겨우 들을 수 있는 정도였다. 라디오 소리의 인터페이스로만 보면 통신과 크게 다르지 않았다. 하지만 라디오는 전화와 같이 유선이 아니라 무선이었다. 이같은 기술적 특성으로 인해 당시 라디오는 유선전화+무선전신으로서 “편리한 무선전화”로 인식되었다(조선일보, 1924. 10. 6, 4면). 이 시기 텔레비전은 “세계를 좌관하는 기계”(조선일보, 1923. 4월 24일, 3면)라든가 “‘라디오’로 활동전송”하는 미디어(조선일보, 1월16일, 2면), 심지어 1950년대 후반까지 “활동사진이 붙은 라디오”였다(동아일보, 1956. 5. 14). 라디오는 개인이 이용하는 통신전화에서, 텔레비전은 그런 라디오에 시각성을 추가한 것에서 인터페이스의 원형을 모색한 것이다. 


무엇보다 라디오는 궁극적으로 ‘소리의 시대’를 연 장본인이었다(이승원, 2005). 전파를 타고 오는 이 낯선 소리는 종각의 종소리, 오포 소리, 전기적 사이렌 소리와 함께 근대를 상징하는 풍경이자 의식이었다. 육성이나 자연음 외에 들리지 않던 ‘고요한’ 전통시대와 달리, 기차와 전차, 자동차, 전화, 유성기, 그리고 라디오 기계음이 복잡함과 익명성, 속도를 특징으로 하는 근대적 공간을 새로이 채우고 있었다. 당연히 도시에서 보다 강렬했지만, 농촌이라고 예외일 리 없었다. “시골 부잣집 사랑방에서 저녁마다 온 동네 사람들이 모여 앉아 ‘공짜’로 라디오 청취”하는(이내수, 2001) 모습은 가족청취가 보편화된 1970년대까지 이어온 전형적인 근대적 풍경이었다. 


일제 강점기에 사용되던 일제 라디오 @춘하추동방송


거리 청취는 근대 도시적 삶의 상징 중 하나였다. 익명적 집단성과 경제관계가 근대도시의 특징이라 볼 때, 라디오는 단순한 청취를 넘어 사람들을 모으고 마케팅을 하는 일종의 수완이었다. 일제 강점기 경성탐보군(1927, 106쪽)은 “이현세상점이나 구미양행에서 확성기로 지나가는 사람에게 라듸오를 들려주는 것은 라듸오기계 판매업이니까 말할 것 없으나 박덕유양화점에서 일백십여원짜리, 조선축음기상회에서 백여원짜리 확성기를 점두에 놓고 손님에게 들려주기 시작하니까 남대문통의 백상회에서도 사백여원짜리 라디오를 놓았다”고 전한다. 당대인들은 이같은 풍경에 비교적 빠르게 적응한 듯 보인다. 당시 동아일보(1933. 11. 2)는 “사람들의 귀는 (근대적으로) 길리어지”는 것이라고 보도한다. 거기에는 일제강점기 후반 전시 상황에서 황국신민이 되도록 하는 라디오 ‘청취지도’도 있었다(정지희, 2013; 이승원, 2005). 집단 청취에서 라디오는 사람을 모으고(음악, 오락) 경제활동을 장려 또는 지도하며(의제), 국가적 목적을 수행하는(동원) 요란한 ‘소리 미디어’였다. 


그렇다고 가족 청취가 없었던 것은 아니다. 가족 청취는 라디오가 대중적으로 보급되고, 정기적인 청취 패턴이 형성되면서 분명하게 나타났다. 라디오가 가족 또는 개인의 생활패턴에 맞게 체계화되고 계획화된 것이다. 이는 편성이 자리잡으면서 보다 변격화되는데, 우리나라의 정기 편성은 종래의 라디오 체제를 유지하면서도 라디오 방송장르와 편성을 미국식으로 현대화한 미군정기에 이르러 체계화되었다. 미국 상업주의적 프로그램 제작과 ‘편성의 합리화’, 정해진 시간을 지켜 방송하는 ‘정시 방송제’, 하나의 프로그램이 연속적으로 편성되는 ‘프로그램 연속성’이 정착한 것이다(임종수, 2004a; 백미숙, 2007). 미국과 일본으로부터 영향받은 각종 토크쇼와 오락 장르, 그리고 대중적 지지와 사랑을 받은 방송극의 등장과 청취 습관(문선영, 2012), 방송기자 제도 등이 정착되면서 라디오는 동시적인 근대적 삶의 패턴을 강화해 갔다. 


이로써 라디오 청취자는 시간을 지켜 해당 프로그램을 정기적으로 소비하는 ‘습관적 청취자’가 되었다. 이는 근대인들이 단순히 시계-시간에 따라 행동하는 것을 넘어 미디어 프로그램이 제공하는 생활적 실천, 즉 어떤 프로그램이 어떤 일상적 행동과 결부되어 있다는 시간관념에 따라 생활한다는 것을 뜻한다(임종수, 2006; 문선영, 2012). 라디오는 일제 강점기에도 정오 시보라든가 <라디오체조> 등으로 시간을 분절하고 청취자의 삶과 정신세계에 침투하려 했지만, 보다 정교한 청취 습관과 일상과의 구조화는 미군정기를 지나면서였다. 이후 1950년대 후반 냉전기 체제에서의 ‘방송(라디오) 재건’, 즉 주요 상업 라디오의 등장과 방송극 및 오락 프로그램을 통한 청취경쟁, 1960년대 후반 지역국의 탄생에 따른 라디오 전성시대, 그리고 1970년대 텔레비전 시대의 개막으로 라디오와 결부된 생활패턴이 보다 강고하게 구조화되어갔다. 


1960년대 전성기를 맞은 라디오는 여전히 정해진 공간, 즉 가정집이나 다방, 소리사(라디오 판매상), 레코드사, 공장, 그리고 자동차 등에서 주로 청취하는 공간제약적 미디어였다. 라디오가 소비되는 공간과 그렇지 못한 공간, 가령 도시와 농촌 간의 라디오 격차는 물론이고 도시 안에서도 라디오 격차가 있었다. 이는 한편으로는 약한 라디오 주파수 문제, 다른 한편으로는 라디오 수신기 보급 문제 때문이었다. 이에 대안적으로 형성된 앰프촌이나 라디오촌이 1960년대 후반에 성행했고, 이른바 ‘농어촌 라디오 보내기 운동’도 당시의 중요한 사회동원 중 하나였다. 


라디오가 공간으로부터 분명하게 자유로워진 것은 1970년대 후반, 본격적으로는 1980년대 소형 트랜지스터 라디오가 널리 보급되면서였다. 자가용의 대중화로 청취공간이 더욱 확장되고, 좋아진 전력 사정으로 밤 시간대 라디오 소비도 활발해졌다. 1970년대 불어 닥친 ‘텔레비전 붐’은 라디오의 변신을 더욱 촉진했는데(임종수, 2004b), 이때부터 라디오 청취는 그 전의 습관적 청취를 더욱 정교화해 특정 시간대에 특정 집단이 결부된 ‘부족화된(tribal) 청취’ 패턴으로 전이되었다. 가령 아침시간에는 출근하는 도시 남성들이, 낮 시간에는 공장 또는 개별 사업 노동자나 주부들이, 심야시간에는 청소년들이 주로 청취하는 것이다. 이에 따라 라디오 편성도 기존의 주요 시간대였던 초저녁보다, 텔레비전 시간을 피할 수 있는 아침이나 낮, 심야 시간대로 주요 편성시간이 변경되었다(최인규, 1976; 최창봉·강현두, 2001). 이같은 편성전략은 1960년대 중반 이른바 ‘청취자 세분편성’을 보다 현실에 맞게 정교화하고 강화한 것이었다. 


라디오를 포함해 여타 소리 미디어의 청취 풍경은 디지털 전환과 함께 크게 바뀌었다. 집단적, 습관적, 부족적 청취 형태는 급격하게 약화되고, 급속하게 확산된 청각 플랫폼에 대한 개인적 청취가 그 자리를 대신했다. 팟캐스트에 대한 여러 연구를 검토한 바에 따르면(이정기, 2018), 팟캐스트는 대체로 오락/시간보내기, 이동성, 대안언론/정보추구, 출연자 매력의 동기를 가진다. 기존 라디오에서의 이용동기와 유사한 가운데 대안언론/정보추구 동기가 특별해 보인다. 즉, 디지털 청각 플랫폼은 기존 라디오의 이동성과 오락성, 출연자 매력에 더하여 다루는 내용의 다양성, 예컨대 시사·정치·사회 분야의 공론장으로서(이기형 외, 2013), 세대나 젠더 등으로 한정된 놀이터로서(장은미·허솔, 2022), 역사, 과학, 문학, 철학 등 특정 분야의 지식(김재원, 2018) 등과 같이 관심사별로 제각각 활용되는 미디어이다. 약 5년에 걸친 팟빵의 일간 순위 분석에 따르면, 청각 플랫폼은 콘텐츠 내용 다양성에 기여하고, 레거시 방송 프로그램의 유입을 허용하지만, 시간이 갈수록 상위권의 다양성은 제한적이고 레거시 콘텐츠의 경쟁력이 강화되었다(윤호영, 2019). 기존의 라디오와 청각 플랫폼 간의 미디어 거리가 점점 좁혀지는 가운데 전래의 대중매체 소리 미디어가 보편적인 디지털 ‘청각 미디어’로 변해간 것이다. 


청각 미디어 수용자는 제각각의 관심, 취향, 목적 등을 토대로 모이고 흩어지기를 반복하는 ‘오디오 유목민’이라 할 수 있다. 물론 출퇴근 시간의 자동차, 집단 노동 공간, 등산로 등 레거시 라디오의 유목적 수용을 어렵지 않게 목격할 수 있다. 하지만 라디오 주파수가 그 어느때보다 공간을 잘 넘나들 수 있음에도, 지금 라디오 소리는 북적이는 도시 한가운데가 아니라 올드 미디어에 여전한 향수를 지닌 기성세대, 특히 고연령층이 운집한 산이나 산책길로 주변화되어 버렸다. 도심에서는 자동차라는 섬으로 제한된다. 가족TV에서 개인TV, 나의TV, 우리TV 등으로 분화하는 영상 미디어처럼(임종수·최세경, 2016), 청각 미디어의 청취(자)는 디지털 전환과 더불어 저마다 각기 다른 관심사에 따라 떠돌아 다니는 유목적 특성을 보인다. 그런 만큼 이제 청취 단위는 그 어느 때보다 철저하게 개인으로 한정된다. 

청각 미디어의 유목적 소비는 여러 형태의 가족 또는 집단적 청취가 만들어낸 소리의 시대를 역사의 뒤안길로 밀어내고 ‘침묵의 시대’를 도래시켰다. 갖가지 전자음 소리가 20세기 대중매체 시대를 풍미했다면, 지금은 그 소리가 이용자 저마다의 이어폰 안으로 들어가 버렸다. 라디오 소리는 물론 거리 곳곳에서 만날 수 있었던 (불법) 카세트 테이프 음악, 연말이면 어디서든 들을 수 있었던 캐럴송 등 소리의 풍경은 이제 지난 세기의 것이 되어 버린 듯 하다. 초고속 네트워크와 블루투스, 무선 이어폰 등은 순수하게 개인이 전래의 라디오 또는 영상 플랫폼의 소리, 전화기 너머 누군가와의 통화, 인공지능 행위자와 ‘조용히’ 상호작용하기 위한 것이다. 청각 미디어는 이전보다 훨씬 더 다양하고 풍부해졌지만, 청각을 확장한 개개인의 디지털 장비 안으로, 급기야 이용자의 귓속으로 들어가 버렸다. 


이제부터는 시각성과 촉각성을 더한 디지털 청각 미디어의 작동과 실행, 수용의 인터페이스를 구체적으로 고찰하고, VUI가 청각성을 어떻게 확장하는지 살펴본다.      


3. 청각 미디어의 인터페이스1: 작동, 실행, 수용     


 이 시대의 청각 미디어는 디지털 요소를 끌어들인 종래의 라디오를 포함해 팟캐스트, 팟빵, 오디오북, 음원 서비스 등 청각 콘텐츠를 일차적인 정보로 제공하는 서비스이다. 따라서 우리는 기존의 영상 플랫폼(흔히 동영상 OTT라고 불리는)과 구분되는 ‘청각 미디어(또는 청각 OTT)의 영역’을 말할 수 있다. 인터페이스 관점에서 그 영역이란 청각 미디어가 ‘작동’되고 ‘실행’되어 ‘수용’되는 방식 모두를 일컫는다. 이들 플랫폼-미디어는 그 자체로서 수용자와 독자적으로 상호작용하는 자동화된 기계, 수학적 모델과 사이버네틱스의 논리를 내포한다. 그렇다면 이제 질문은 청각 미디어가 구체적으로 어떻게 정보를 처리하면서 작동과 실행, 수용의 문화적 인터페이스를 구현하는가로 모아진다. 


첫째, 청각 미디어는 전래의 소리 자원에 시각과 촉각 자원을 더한 자동기계의 인터페이스를 작동시킨다. 재매개 논리로 보면(Bolter & Grusin, 1999), 청각 미디어는 디지털 기술에 의한 고품질의 음성, 이물감 없이 언제 어디서나 원하는 콘텐츠를 불러들이는 내부 미디어(intra-medium) 장치 등 높은 수준의 비매개성과, 비물질적인 가상의 조작장치, 전화는 물론 문자서비스, 메시지, 다양한 앱, SNS 등 다양한 상호작용 기제들이 간섭하는 하이퍼매개성을 띤다. 이 두 측면이 자동기계 청각 미디어의 작동방식을 구성한다. 위너(Wiener, 1948)의 사이버네틱스에 따르면, 인간처럼 스스로 생각하는 기계장치는 시스템이 안정된 상태를 유지하려는 항상성(homeostasis)과 그런 시스템에서 발생하는 사건을 규칙에 따라 시스템에 다시 되돌려주는 피드백 루프(feedback loop)를 기본요소로 한다. 거기에서 더 나아가, 잘 디자인된 기계장치는 이용자의 관심과 행동을 한 걸음 앞서 예측하여 특정 콘텐츠나 프로그램을 추천 형식으로 선행적으로 제시한다(피드포워드). 동물이든 인간이든, 심지어 기계조차도 위와 같은 특성을 내재한 사이버네틱스 의사소통 과정으로 설명될 수 있다. 인간에게 있어 기계는 궁극적으로 그런 과정이 작동되도록 디자인할 수 있는 행위자이다.


프로그램 진행 화면, 온디맨드 청취, 시간전환(time-shift), 게시판과 댓글 등 프로그램 진행과 관련된 각종 참여도구, EPG 형태의 추천 편성과 셀프 편성(수용자가 선호하는 콘텐츠를 시간대별로 편성하는 것), 다양한 디지털 플랫폼과의 연결을 지원하는 SNS 등을 포함한 ‘보이는 라디오’는 튜너와 소리조절 장치만 있던 라디오가 인간과 상호작용할 수 있는 자동생산체계로 진화했음을 보여준다. 여기에는 가상의 시각적 인터페이스는 물론 청각적, 촉각적 인터페이스도 포함한다. 미디어가 이용자마다 다르게 표현해 내는 생성적 편성은 자동생산체계의 결과물이다. 그 인터페이스는 시각적인 배치로 나타나는데, 그 방식으로는 일찍이 넷플릭스가 선보인 이용자 필터링과 콘텐츠 필터링 기법을 적용한 모듈식 카테고리 추천이 활용된다. 가령, 2022년 8월 현재 팟빵의 경우, 자체적으로 엄선한 ‘추천 에피소드’, 2022년 여름을 강타한 고온과 폭우 등 이상기후 상황을 반영한 ‘지구의 경고, 이상기후’, MZ 세대를 이해하는 ‘요즘 것들의 요즘 이야기’, 이용량이 급증하는 ‘지금 뜨는 이야기’ 등의 카테고리를 제공한다. 


청각 미디어는 이용자 저마다의 관심사를 이같은 인터페이스의 기준점으로 삼는다. 동영상 OTT가 스토리텔링에 기반한 ‘미적 취향’을 제공한다면, 청각 플랫폼은 기존의 라디오가 수행해 오던 시사와 정보, 다양한 유형의 오락, 음악으로 대표되는 예술은 물론 과학, 역사, 지식, 문화 등 자신의 이념, 태도, 아이디어를 지지하는 ‘관심사’를 제공한다. 청각 미디어의 콘텐츠 수용 데이터와 기존 라디오 콘텐츠 데이터 간의 자연스러운 정보처리로 관심사 항목이라 할 주제 또는 분야가 찾아지고 설정되는 것이다. 크게 보면 청각 미디어에서 관심사는 의제, 오락, 지식으로 범주화될 수 있다. 청각 미디어는 완성된 제품의 교환이기보다(음원 서비스 제외) 유사한 생각을 가진 사람들의 참여를 통해 이같은 관심사 항목이 기획, 제작, 유통된다. 


둘째, 청각 미디어는 시사/정보, 문화/예술, 지식/오락 등으로 분류되는 관심사를 실행한다. 이같은 실행 분야는 기존의 라디오와 비슷하지만, 라디오에 비해 그 외연이 넓고 깊다. 청각 미디어의 시사/정보는 기존의 라디오보다 훨씬 더 강렬하게 개개인의 이데올로기 또는 지향성에 어필한다. 전통적으로 텔레비전에 비해 방송설비나 시스템 면에서 가벼운 라디오는 전국 단위 의제설정은 물론이고 지역사회의 의제설정이나 마을과 같은 공동체 형성에 있어서 중요한 역할을 해 왔다(황유선·송인덕·김재선, 2014; 이희랑·김희영, 2017; 반명진·김영찬, 2016; 강진숙·이은빈, 2013). 디지털 청각 미디어는 여기에 특정 주제, 인물, 지역 등을 토대로 그 외연과 깊이를 극대화한다. 시장성 면에서 동영상 OTT에 비해 열세지만, 특정 관점에서 흥미로운 이야기나 해석 등을 퍼 나르면서 매니아 그룹을 조직하기도 한다. 


청각 미디어는 음악이나 독서, 공연 등 문화/예술 형식을 더욱 가치있게 고양시킨다. 음악은 지난 20세기 라디오가 성장하는데 크게 기여했던 콘텐츠 형식 중 하나이자 소리 예술을 대중화한 장본인이다. 즉, 라디오 음악 서비스는 무료 보편이라는 점뿐만 아니라 전문가에 의한 엄선과 해석 등 청각 문화의 핵심 자원이었다. 하지만 지금은 그 기능의 상당부문을 청각 미디어의 음원 서비스가 대신하고 있다. 음원 서비스는 동영상 OTT와 유사한 희귀 자원의 서비스이다. 음원 서비스에서 제공되는 궁극적인 콘텐츠는 제품이라는 것이다. 다만 음원 서비스에서 음악 제품의 도출 또한 거기에 참여하는 사람들의 다양한 음악적 취향, 즉 장르나 주제, 분위기, 아티스트 등 취향 분석에 따른 인터페이스의 결과이다. 


청각 미디어는 기존의 라디오와 달리 역사, 과학, 문학, 철학, 생활, 상담 등 특정 분야의 지식/오락을 심도있게 다루는 콘텐츠 영역을 개척한다. 사실 이것이 기존의 라디오와 가장 구별되는 점이다. 기존의 라디오가 전문가에 의한 일회적 정보제공에 그쳤다면, 청각 미디어는 특정 주제, 인물, 영역 등을 토대로 넓고 얕은 또는 좁고 깊은 정보를 제공한다. 수차례 되풀이해서 청취할 수도 있다. 대표적으로 수년 전 팟캐스트 <지대넓얕; 지적 대화를 위한 넓고 얕은 지식>의 성공은 청각 미디어에서의 지식 정보 콘텐츠의 위치를 보여준다. 그 범주에는 법률이나 과학과 같은 전문 지식은 물론 건축, 가드닝, 기구 등 노하우 지식, 성이나 역사, 문화 같은 교양 지식도 포함된다. 이같은 지식 정보는 오락과 크게 구분되지 않는다. 깊이 있는 지식이 주는 즐거움과 재미가 곧 오락이 되고 있다. 청취자가 관심사별로 나눠지기 때문이다. 물론 청각 미디어에는 전형적인 오락 콘텐츠도 많다. 


'지적대화를 위한 넓고 얕은 지식'은 라디오가 아닌 청각 미디어의 새로운 가능성을 개척한 것으로 평가된다.


셋째, 청각 미디어의 이같은 실행범주는 라디오와 텔레비전 등 대중매체 수용이 몰고오는 일상성의 흐름을 대체한다. 대중매체가 국가공동체와 개인의 삶을 연결시키는데 기여할 수 있었던 것은 하루하루의 삶과 결부될 수 있는 특유의 침투력 때문이었다. 라디오는 정서적 리얼리즘이나(주창윤, 2011) 진행자와의 의사상호작용(이호준 외, 2008), 더 나아가 청취자와의 상호작용(김광재·은혜정, 2013) 등 다양한 수용행태를 보여왔다. 청각 미디어는 광범위한 관심사 수용을 통해 진행자나 참가자들과 일상적인 상호작용 상태에 있다. 그것은 그 어느 때보다 깊이있는 상호작용, 높은 효능감 등을 제공하지만, 이른바 확증편향이나 에코챔버 같은 한계를 드러내기도 한다. 실제로 편향성 시비나 파편화된 편성흐름에 대한 지적에도 불구하고, 각종 청각 미디어 청취자들은 자신이 원하는 콘텐츠 또는 진행자에 대해 높은 수준으로 감정이입한다(곽정원·정성은, 2013; 이기형 외, 2013). 전통적인 라디오가 사회의 평균적인 공통문화(common culture)를 제공했다면, 디지털 청각 미디어는 저마다 지향하는 관심사에 따라 콘텐츠를 소비하는 가운데 지배적인 정서 또는 미학을 생성해 낸다. 


청각 미디어가 이같은 수용성을 보이는 것은 관심사를 실현하는데 기여하는 높은 수준의 익명성과 참여가능성(participatibility) 덕분이다. 목소리 외에 그 어떤 정보도 보이지 않는 익명성은, 수용자를 식별하는 디지털 미디어의 높은 기술 수준에도 불구하고, 기존의 라디오는 물론 다양한 청각 플랫폼에서도 여전히 시민의 참여를 끌어내는 중요한 덕목이자 콘텐츠 진화의 원동력이다. 참여가능성 또한 마찬가지이다. 전국적으로 뻗어있는 전화 및 문자서비스 장치로 인해 누구라도 청각 미디어에 초대될 수 있다. 이같은 각종 상호작용적 기제들로 인해 청각 미디어는 라디오 진행자들만의 일방적 커뮤니케이션이 아니라 익명적 다수의 즉시적 참여의 장이 될 수 있다. 때때로 익명적 참여가 오용되는 경우도 있다(대표적으로 정치적 주제로 한 금전적 후원). 관심사의 오용을 어떻게 풀어갈지 지켜볼 일이다. 


2010년 무렵 팟캐스트에서 시작한 청각 미디어는 의제, 정보, 오락의 측면에서 수용자 개개인의 관심사를 크게 확장시켰다. 최근 청각 미디어의 이같은 속성은 유튜브, 아프리카TV, 인스타그램, 틱톡 등으로 급속하게 확장 또는 이전되고 있다. 시각 정보가 제공하는 폭넓은 표현가능성이 청각 미디어의 관심사 콘텐츠와 맞아 떨어졌기 때문으로 보인다. 영상 리터러시가 풍부한 MZ 세대의 성장도 한 몫 했을 것이리라. 심지어 이들 미디어 또한 음악, 영화, 드라마, 다큐멘터리 등 미학적 취향을 만족시키는 콘텐츠 형식에 눈을 돌리기도 한다. 그렇게 보면, 특정 플랫폼-미디어와 속성은 일대 일 관계가 아닐지도 모른다. 그럼에도 청각 미디어가 디지털 미디어 진화와 그 지형학에 남기는 의의가 있다면, 관심사가 플랫폼-미디어를 디자인함에 있어 중요한 정신적 속성이라는 점이다. 그러는 동안 청각 미디어의 인터페이스는 VUI로, 무선 이어폰으로 확장되어 다양한 방식으로 관심사를 소비할 수 있게 되고 있다.      


4. 청각 미디어의 인터페이스2: VUI, 청각의 확장     


청각 정보는 특유의 자유로운 주목도로 인해 다양한 인간활동과 접목될 수 있다. 이는 시각적 수용이 요구되는 텔레비전 또는 동영상 OTT와 다르다. 물론 시각 미디어 역시 ‘거실의 텔레비전’을 넘어 도시의 주요거리, 지하철, 백화점, 터미널, 병원 등에서 인간과 상호작용하는 능동적 미디어로 진화하고 있다. 하지만 그에 못지않게, 오히려 그 이상으로 청각 미디어는 인간의 말(speech)에 대한 응답, 그런 응답에 반응하는 인간, 다양한 신체활동과 더불어 소비되는 멀티태스킹을 용인한다(김지완, 2020). 한 조사에 따르면(강민정, 2022), 팟캐스트는 업무/공부, 운동, 가사, 취침, 운전 등의 행동과 함께 이용되며, 청취 상황별로는 이동, 핸드폰 사용, 식사, 취미 생활, 게임 중의 상황에서 이용하였다. 


그런 한편, 청각 정보는 배경으로 활용하는 음악을 제외하면 그것이 실행되는 순간 이용자를 자신이 위치한 현실로부터 순식간에 분리시킨다. 단순히 청각 정보를 들을 때도 그렇지만(특히 이어폰으로 듣는 경우), 말하기/듣기 인터페이스에서 특히 그렇다. 수많은 모바일 연구에서 말하는 것은 청각이 연결과 함께 이곳에서 저곳으로 완전한 주목의 전환이 일어난다는 것이다. 청각 미디어는 물론 자동차, 자전거, 키오스크 등 비미디어에서의 청각 시스템과 그 주변기기는 이용자의 관심과 주목을 지금 이곳으로부터 순식간에 이탈시켜 다른 여타 세계와 활동으로 미끄러져 들어가게 한다. 모바일 사용에 따른 공동공간감(awareness of co-location), 무매개적 공존감(immediacy of co-presence), 시공간 원격화(time-space distanciation) 등이 한 차원 더 깊게 착근하는 것이다(임종수, 2009 참고). 결국, 청각 미디어는 신체적으로는 다중활동을, 인지적으로는 하나의 주목만을 요구한다. 생소하지만 점점 더 발전하는 VUI의 말하기/듣기 인터페이스에서 관심가져야 할 부문이다. 


이에 대해서는 맥루언(McLuhan, 1964; 1967)이 말한 “인간의 확장”(extensions of man)과 “감각의 균형”(sensory balance) 개념이 하나의 길잡이가 될 수 있다. 널리 알려져 있듯이, 맥루언 미디어론은 미디어의 선차성, 관계설정의 기제로서 미디어, 인간의 연장으로서 미디어, 그에 따른 감각비율의 변화, 감각 확장의 여정으로서 인류의 역사 등으로 설명된다. 미디어에 대한 그의 주요 관심사는 인류의 역사를 매개(물)의 관점에서 파악하는데 있다. 그가 주목한 것은 인간의 삶의 조건이나 인식체계에 미치는 미디어의 힘에 관한 것이었다. 맥루언에 따르면, 선사시대의 미디어인 손도끼는 몸 기능의 확장을 뜻하지만, 정보 전달이 중요해진 문자 미디어 시대의 그것은 시각 감각의 확장, 더 나아가 그렇게 불균형한 신경체계로의 변화를 이끈다(서요성, 2017 참고). 즉, 오랜 세월 이어온 구술문화의 감각체계는 문자 미디어의 등장으로 시각 중심주의의 궤적을 주류화함으로써 인류의 시각적 신경체계가 과잉 확장했다는 것이다. 


맥루언에 따르면, 그런 상태에서 텔레비전 같은 전자 미디어는 청각을 포함한 다른 감각을 회복시킴으로써 신경체계와 인식체계를 균형있게 복원한다(원만희, 2002 참고). 전자 미디어 특유의 공감각적 사용에 대한 나름의 진단이다. 그의 생각은 1960년대 텔레비전을 두고 전개되었지만, 미디어의 독자성 또는 능동성이 커진 청각 미디어에서 여전히 되새겨볼 만 해 보인다. 그의 생각을 토대로 디지털 미디어를 떠올려 보면, 이제 미디어는  ‘메시지로서 미디어의 강화’, ‘시각형 인간에서 복수감각형 인간으로’, ‘감각의 급격하고도 무한한 확장’ 등이 가능해질 것이다(박일호, 2008 참조). 미디어를 인간과 상호작용하는 모든 것으로 보는 맥루언의 시각이 디지털 미디어의 시·청·촉각 기술과 장치로 인해 현실화되고 있다.


최근 확장되고 있는 청각 미디어는 공감각적 특성, 즉 디지털 신호에 대한 시각적 촉각적 경험 외에 말하기/듣기의 인터페이스로 인해 미디어를 보다 공감각적이게 만든다. MCU 영화의 아이언맨(Ironman)과 대화하는 ‘자비스’ 사례에서 힌트를 얻을 수 있을 것이다. 여러 AI 스피커는 그같은 인터페이스 효과를 향해 가고 있다. 맥루언에 따르면, 말은 명징성, 즉각성, 동시성 면에서 시각성과 비슷하지만, 소리에서 들리는 특유의 주변정보로 인해 훨씬 더 공감각적 표현방식이다. 목소리는 말의 메시지 외에 단서가 될 정보를 많이 포함하기 때문이다. 주지하듯이, 목소리에는 떨리는, 주저하는, 당황하는, 화난, 차분한, 무미건조한, 미려한, 달콤한 등과 같은 촉각과 시각, 심지어 미각적 요소라고 하는 것도 포함한다. 이로 인해 말하기/듣기 인터페이스는 청자를 소리가 발생하는 세계와 일체감을 갖도록 공감각을 요구한다. VUI 환경은 청각 미디어가 이해할 수 있도록 초집중의 지각을 요구한다. 


이것이 VUI의 말하기/듣기 인터페이스가 청각의 경험을 확장한 생소하면서도 흥미로운 가능성의 측면이다. 인공지능 목소리를 위한 자연어 말뭉치 사업은 말하고 있는 상황과 조건, 부사와 형용사, 조사, 심지어 사투리의 사용 등에 따라 그 말이 인간이 하는 것만큼이나 자연스럽게 만들고자 한다. 가상모델은 물론 현실의 모델이나 스타의 음원을 바탕으로 적절한 목소리를 표현할 수도 있다. 지난해 국내기업 네이버의 하이퍼 클로바(Hyper Clova)와 최근 오픈AI에서 업그레이드 한 ChatGPT는 기계적인 대화가 아닌 지식과 정보, 정서를 고려한 맥락적 대화는 물론 문제해결, 심지어 창작도 곧잘 해낸다. 언어와 언어간의 관계가 수백만 또는 수천만 매개변수에서 수천 억 개의 매개변수로 확장되면서 이르게 된 이른바 초거대 AI 덕분이다. 미세한 소리마저 잡아내는 디지털 음원기술과 각종 표현도구, 음원 실행도구의 발전도 한 몫 했음이 분명하다. 이제 이런 시스템은 거추장스러운 스피커에서 손바닥만한 스마트폰으로, 다시 블루투스의 높은 해상력으로 말미암아 어디에서든 활용할 수 있다. 


오픈AI의 ChatGPT는 생각없는 지능(intelligence without mind)의 새로운 차원을 개척했다.


하지만 여전히 의문은 남는다. 디지털 전환 이후 실제로 시각성의 지배력이 교정되었는가? 오히려 디지털 기술이 영상 시대를 엶으로써 시각성을 한층 더 강화한 것은 아닌가? 앞서 살펴본 것처럼, 팟캐스트에서 성공한 서비스의 상당부문이 유튜브로 진출하는 것을 보면 그런 듯 보인다. 청각 미디어가 시각에 절대적으로 기울어진 감각 비율을 교정하여 인간의 지각구조를 수정한다고 하지만, 더 나아가 듣기/말하기의 AI 스피커가 새로운 청각/구술 미디어의 가능성을 열었다고 하지만, 디지털 기술이 감각비율을 조화롭게 했다는 것을 경험적으로 느끼기에는 한계가 있는 것처럼 보인다. 


맥루언이 말한 문자적 시각성의 논리는 청각 미디어의 인터페이스에도 여전히 강력하게 작동하는 것으로 보인다. 청각과 소리의 구술성은 어디까지나 문자적 의사소통의 문화적 체계 위에 세워진 ‘이차적 구술성’(the secondary orality)이기 때문이다(Ong, 1982). 문자 탄생 이전 원시시대의 일차적 구술성과 달리, 전화, 라디오, 텔레비전에서의 이차적 구술성은 어린 시절부터 교육받아 온 교과서나 소설책, 그리고 방송사 대본 등 문자적 기록 위에 구축된 구술이다. 거기에 문자와 구술의 경계가 사라지고 동시성과 비동시성의 공존하며 전지구적 참여가 일상 다반사로 상정되는 이른바 제3의 구술성(이동후, 2010), 더 나아가 인공지능 행위자가 구술의 대상이자 주체인 구술성 역시 사실은 문자적 토대 위에서 이루어지는 구술성이다. 이는 기술적으로 자연스러운 인간의 구술성이 (적어도 아직까지는) 미디어에 실현되기가 그리 쉬운 일이 아님을 뜻한다. 그럼에도 최근의 생성적 AI 또는 초거대 AI로의 전환은 직관성을 토대로 하는 청각 미디어의 확장을 크게 고무시키고 있다. 사실 단순한 TTS 마저 문자의 시각성으로는 파악하지 못하는 오문과 비문, 맥락적 이해 등을 교정하는데 많은 도움을 준다. 청각의 직관성 때문이다. 


결과적으로, 시각성의 우위는 자본주의 체제 하 미디어 산업의 자연스러운(?) 선택이자 그 결과인지도 모른다. 기본적으로 시각 또는 청각 장애인과 그렇지 않는 사람들의 시장 크기는 비교 자체가 무의미할 정도이다. 그럼에도 불구하고, 청각 미디어를 디자인하기 위한 지적, 미학적 기획이 무의미하다고 단정할 수는 없다. 특히 고령화 시대를 고려할 때, 미디어의 시각적 편중에 대한 반성이 필요해 보인다. AI 스피커 연구가 가장 활발한 분야가 에이징 커뮤니케이션(aging communication)이라는 사실이 이를 증거한다. 뇌병변 등으로 언어활동과 인지기능이 떨어진 노인은 물론 그렇지 않은 고령의 노인들조차도 AI 스피커는 의약적 보조와 심리적 위로 등 노인들의 활동과 정서 모두에서 긍정적인 역할을 한다. ‘효돌이’ 사례에서 보듯이, 로보틱스 기술과 결합된 AI 스피커는 실버산업의 새로운 가능성을 보여준다(김선화 외, 2020). 뿐만 아니라 최근 ‘리얼 돌’이나 ‘테슬라봇’ 현상에서 보듯이, 신체 장애가 없는 사람들을 대상으로 하는 청각적, 촉각적 로봇 시장 또한 꿈틀대고 있다.  


청각 미디어의 VUI 인터페이스 확장은 여러 잇점을 가지고 있다. 지난 수 년 동안 기술기업은 오디오북, 오디오 시네마, 오디오 드라마 외에 인공지능을 이용한 AI 스피커 개발에 박차를 가하고 있다. 이제는 그 외연을 넓혀 커넥티드 카(connected car) 같은 비미디어 분야로 확대하고 있다. 커넥티드 카는 자동차가 자동차 회사 또는 네비게이션, 보험회사의 클라우드를 통해 다른 차량이나 도로 기반의 시설들, 타인의 단말기 등과 교통안전 정보를 주고받음은 물론, 실시간 길 안내, 차량점검, 그 외에 OTT와 각종 SNS 등을 차량 안에서 이용할 수 있는 것을 말한다. 어떤 보험회사는 커넥티드 카 할인 특약을 통해 사고시 자동으로 통보하는 장치를 운영 중인데, 이 경우 커넥티드 장비가 운전자의 운전 습관을 점수화해 가입여부를 결정한다. 흔히 ‘바퀴달린 스마트폰’으로 불리는 신개념 전기차는 단순히 배터리 동력으로 차가 굴러가는 것을 넘어 운전자의 안전과 편의를 위한 여러 가지 커뮤니케이션 장치로 진화하고 있다. 커넥티드 홈에 이은 커넥티드 카, 최근에는 커넥티드 자전거에 이르기까지 로봇 산업이 청각 미디어와 결합될 수 있는 여지는 충분해 보인다.    

  

5. 청각 미디어의 인터페이스3: 무선 이어폰, 신체의 일부     


마지막으로 청각 미디어 인터페이스에서 무선 이어폰의 의미를 되짚어 보아야 한다. 단언컨대, 무선 이어폰은 수용자가 미디어 이용에 있어 공간적 자유를 누리는데 기여한 일등공신이다. 그간 무선 인터넷의 발전에도 불구하고, 무선 서비스에 적합한 인간활동은 크게 성장하지 못했다. 수용자에게 일방향의 직진성을 보이는 영상과 달리, 소리는 공간적으로 퍼져나가는 성질로 인해 노출이 더 꺼려지지만 사용할 수 있는 장치는 유선 이어폰 전부였다. 하지만 유선 이어폰은 단말기와 인간신체를 구속하는 문제가 있었다. 무선 이어폰은 단말기 장비의 제한, 더 나아가 인간 신체 활동의 제한을 확실히 없애버렸다. 즉, 인간의 미디어 수용은 물론 여타 활동이 그 근거가 되는 미디어와 악세서리(거추장스러운 줄)로부터 자유로워졌다. 무선 이어폰이 단말기 너머로 인간(감각)이 확장하는데 선구적인 역할을 한 것이다. 시각성은 보기를 위해 거추장스러운 매질이 필요한 반면, 청각성은 귀 속의 공기 떨림만으로 실현가능하다. 


이미 무선 이어폰 사용은 더 이상 특별한 일이 아니다. 4년여 전부터 유통 플랫폼에서는 무선이어폰 판매 점유율이 전체 이어폰의 60%를 넘어섰다(김성환, 2018). 한 연구에 따르면(구은서·김승인, 2020), Z세대에게 있어 이어폰(특히 무선 이어폰)은 스마트폰과 더불어 ‘신체의 일부’(또는 청각의 확장)라 할 수 있을 정도로 삶의 중요한 수단이다. 이어폰으로 주로 소비하는 콘텐츠는 음악, 짧은 동영상, 동영상 OTT, 라디오 및 팟캐스트 등인데, 흥미로운 것은 이어폰에 대한 태도이다. Z세대에게 이어폰 없이 외출하는 것은 불안을 야기할 정도이다. 심층인터뷰 내용을 보면, 이어폰은 목적적이기보다 습관에 가까우며, 동료집단에서 선호하는 특정 브랜드에 강한 애착을 보인다. 심지어 또래 집단에서는 타인과 쉽게 공유하는 태도도 보인다. 


무선 이어폰은 청각 미디어의 인터페이스와 사용성을 획기적으로 확장시켰다(@brookstone.com)


무선 이어폰 이용에서 초기 광석식 라디오의 “편리한 무선전화”, 즉 조용한 미디어를 떠올리는 것은 과학적 엄밀함을 넘어서는 일이지만, 상상력을 자극하는 것은 어쩔 수 없다. 지금의 디지털 온라인 서비스가 전통적인 통신에 컴퓨터 처리(computer process)된 새로운 영역, 즉 정보서비스(information service)로 제도화된 것이라고 할 때(Cannon, 2003), 통신에서 방송 미디어로 분화되었던 라디오가 다시 통신을 물리적으로나 개념적으로 재장착하는 것은 역사적 아이러니처럼 보인다. 이 시대 대부분의 플랫폼-미디어는 방송처럼 모든 수용자에게 동일한 시간에, 똑같은 콘텐츠를, 일방적으로 제공하지 않는다. 전화사용이 제각각이듯, 지금의 미디어는 시공간, 콘텐츠 형식, 커뮤니케이션 형식 등 모든 면에서 제각각으로 소비된다. 전형적인 청각 미디어는 물론 시각 미디어마저도 무선 이어폰으로 인해 편리함 너머 수용자 저마다 다른 차원의 미디어 소비행태로 나아갈 수 있게 되었다. 어쩌면 머지 않아 화면을 들여다 보지 않고 귓속 대화만으로 정보와 지식을 검색하고 대화하는 것이 일상화될 지도 모를 일이다. 


요컨대, 청각 미디어와 무선 이어폰은 시공간적으로 자유로운 콘텐츠 소비를 촉진하는 것을 넘어 청각 정보의 공감각적 수용 욕망을 자극한다. 청각 미디어와 그 콘텐츠는 일방적으로 콘텐츠를 제공하던 기성 미디어 영역 너머에 상상하기에 따라 그 어떤 서비스도 연출할 수 있다. 청각 미디어는 주목의 자원을 한 곳으로만 몰아가는 시각 미디어와 달리, 특정 공간의 분위기와 관계, 특정 시간 등과 연동해 공감각적으로 이용될 수 있다. 인공지능 원천기술의 발달은 그 가능성을 한층 더 고양시킬 것이다. 청각적 인터페이스를 어떻게 디자인하는가는 시각 중심의 미디어 환경을 보다 풍부하게 그러면서도 인간 친화적으로 바꾸는데 핵심 문제이다.  

    

6. 결론: 관심사와 청각 미디어, 복잡계 미디어 디자인을 위하여     


    역사적으로 온라인 라디오 서비스는 인터넷 초기부터 제공되었다. MBC 인터넷 라디오는 1996년 2월 12일 방송사 홈페이지를 통해 실시간 스트리밍 서비스를 제공했다. 독자적인 라디오 서비스는 거의 10년이 지나 2006년 ‘MBC 미니’를 시작으로 KBS는 ‘Kong’, SBS는 ‘Gorealra’, EBS는 ‘EBS Bandi’ 서비스를 PC 환경에서 제공했다. 스마트폰 앱으로는 2014년 11월경에 시작했다. 인간의 목소리를 포함한 각종 기계음이 삶의 공간을 가득 채웠던 그 때로부터 한 세기만에 일어난 극적인 변화이다. 


이제 곧 초기 인터넷 라디오도 한 세대를 넘어서게 된다. 청각 미디어는 어디로 가고 있는가? 디지털 라디오는 온라인 라디오 서비스에 비해 소요 데이터가 최대 1/20 수준임에도 미래는 여전히 불확실해 보인다(안하늘, 2017). 청각 미디어를 인간(감각)의 확장으로 디자인하고자 하는 혁신성, 희귀 제품의 제공이 아니라 갖가지 참여로부터 콘텐츠를 생산하고자 하는 창의성이 보이지 않기 때문이다. 그런 일은 전통적인 라디오의 디지털화가 아닌 태생부터 디지털 창작도구를 활용할 줄 아는 온라인 디지털 플랫폼이 더 잘해 왔다. 


역사적으로 미디어의 디지털 데이터화(digitization)와 디지털 채택(digitalization)은 두 경로, 그러니까 기존 미디어의 디지털화와 인터넷에 기반한 디지털 플랫폼의 생성의 길을 밟아 왔는데, 지금까지 혁신이나 시장의 방향으로 보면 후자가 전자를 능가한다(임종수·선지원, 2022). 그러면서 후자가 디지털 전환(digital transformation)을 주도한다. 그런 점에서 모든 시청각 서비스를 ‘동일 서비스’로 보려는 시각은 몰역사적, 몰이론적 태도이다. 디지털 플랫폼은 레거시 미디어와 비교해 물리적 하부기반 면에서, 커뮤니케이션 모델 면에서, 비즈니스 구조 면에서, 사용의 목적과 효과 면에서 다르다. 이 글은 초기 소리 미디어에서 청각 미디어로 이어지는 역사적 계보와 함께 청각 플랫폼의 인터페이스 고찰을 통해 디지털 기술이 청각 미디어를 어떻게 디자인하고 확장해가는지 살펴보았다. 


청각 미디어의 인터페이스는 서사적 이야기를 특징으로 하는 동영상 플랫폼의 그것과 사뭇 다르다. 청각 미디어는 미학적 취향과 달리 관심사, 즉 시사/정보, 문화/예술, 지식/오락 등을 최적화하는 가운데 작동방식과 실행방식, 수용방식을 디자인해 왔다. 디지털 기술에 힘입어 청각 미디어는 이용자의 관심사를 시각적이고 촉각적이며, 심지어 청각적인 인터페이스를 구축해 가고 있다. ‘보이는 라디오’의 비전은 유일한 소리 미디어였던 라디오를 다양한 감각, 관심의 실행, 생성적인 공통문화를 창발하는 디지털 청각 미디어로 탈바꿈시켰다. 청각 미디어는 관심사의 속성을 바탕으로 디자인되고 있다. 하지만 관심사가 청각 미디어만의 배타적인 속성이라 단정하기는 다소 망설여진다. 최근 청각 미디어에서 시작한 서비스가 유튜브로 대거 이전해 간 것을 보면 플랫폼-미디어의 속성은 단순히 일대 일로 대응하는 것이 아닐지도 모른다. 지금도 미디어 진화가 진행 중이기 때문에 이 문제는 여전히 유동적이다. 디지털화와 디지털 전환이 시작된 이후 미디어 진화는 아직 끝나지 않았다.


그럼에도 청각 미디어는 시각 중심의 미디어 지형을 고르게 하는 균형추가 될 수 있지 않을까 싶다. 지금까지의 재매개 과정을 볼 때, 미디어는 시나브로 인간과 대화하는 행위자의 지위를 넓혀왔다. 지금 우리는 인간의 관심사를 반영한 무척 자연스러운 VUI를 소비하고 있다. 책과 뉴스를 읽어주는가 하면, 자신의 생각을 문자로 남기고, 자연스러운 대화의 결과 원하는 정보와 지식을 찾기도 한다. 최근 출시된 자동차는 운전자에게 자꾸 말을 건다. 수천 억 개의 매개변수로 성장한 초거대 AI의 딥러닝은 특이성(singularity)의 시점이 생각보다 빨리 도래할 지도 모른다는 생각을 품게 한다. 그런 점에서 지금까지 디지털 플랫폼을 단순히 콘텐츠 생산과 소비 관점에서 바라봤다면, 앞으로는 플랫폼 자체의 고도화, 궁극적으로는 미디어가 인간이 이해하기 쉽도록 디자인하는 의인화(anthropomorphism)의 관점에서 주목할 필요가 있다. 플랫폼은 콘텐츠를 낳고 콘텐츠는 하위 플랫폼을, 다시 하위 콘텐츠를 낳아 급기야 플랫폼을 거대한 콘텐츠 성단으로 만들어낸 다음 할 수 있는 것은 스스로 똑똑해지는 것이지 않을까? 


청각 미디어와 그 인터페이스가 복잡계 이론으로부터 이해의 단초가 마련될 수 있음을 다시 한 번 강조하면서 마무리하고자 한다. 앞서 문화이론가 존 어리(Urry, 2005)가 진단한 ‘복잡성으로의 분기’(complexity turn)에 대해 언급한 바 있다. 복잡성으로의 분기는 물리학과 생물학, 생태학, 경제학 분야에서 활발히 전개되어 온 것으로, 이제 인터넷 네트워크가 저마다의 공간으로 파고든 21세기에 이르러 미디어 커뮤니케이션 분야에서 가장 주목받을 것이라는 진단이었고, 지난 10여년은 그것을 실증해 보였다. 어리가 역사적 경험에서 연원하는 레이몬드 윌리암스의 감정구조(structure of feeling) 개념(Williams, 1977)을 차용하면서 언급한 ‘복잡한 감정구조’(complex structure of feeling)란 날로 그 쓰임새가 커지는 추상기계가 자기 조직화라는 복잡한 과정을 통해 어떤 정신적 속성이 생성됨을 일컫는다. 플랫폼의 복잡계 네트워크는 현대인들의 복잡한 정신활동의 창발을 내재화한 것이다. 따라서 이 시대의 미디어는 취향, 목적, 관심사라는 속성의 복잡성으로부터 어떤 창발을 끌어낼 수 있는지에 따라 성패가 나눠진다. 이제는 비미디어 영역마저도 미디어가 요구하는 정신적 속성을 주요 요소로 디자인될 가능성을 열어두고 있다. 


복잡계 미디어는 디지털과 온라인 네트워크가 가져온 복잡성으로의 분기로부터 탄생한 능동적인 행위자 미디어이다. 구체적으로 복잡계 미디어는 초연결적 상호작용으로부터 전해지는 데이터의 되먹임 과정을 통해 어떤 질서를 창발하는 자동생산체계이다. 그것은 고정된 어떤 개체로서가 아니라 속성으로서 존재한다. 그러면서 생활 곳곳에 스며있는 공기와 같다. 인간을 포함한 개체는 되먹임을 기반으로 하는 계의 독자적인 자동생산체계 속에서 어떤 속성을 소비할 뿐이다. 이 시대의 미디어 인터페이스는 바로 자동생산체계로 기능하면서 구현하는 속성의 발현이다. 청각 미디어 인터페이스로부터 우리가 얻을 교훈이 있다면, 청각 미디어가 관심사라는 속성에 대해 말하고 듣는 미디어로 진화하고 있다는 것이다.           


■ 참고문헌

강민정 (2022). 팟캐스트 콘텐츠 이용자 행태분석 및 유형 파악, <한국콘텐츠학회논문지>, 22권 3호, 94-104.

강진숙·이은빈 (2013). 공동체라디오 DJ의 미메시스적 실천과 유희성 연구: 창신동 라디오방송국 <덤>을 중심으로, <방송문화연구>, 25권 2호, 37-66.

경성탐보군 (1927). 商界閑話, <별건곤>, 1927년 3월호, 106-107호.

곽정원·정성은 (2013). 정치 팟캐스트의 제삼자 지각영향 요인에 관한 연구: 팟캐스트 <나는 꼼수다>의 영향력 지각을 중심으로, <한국언론학보>, 57권 1호, 138-162.

구은서·김승인 (2020). Z세대의 이어폰 사용행태 분석을 통한 사용자 경험 연구, <디지털융복합연구>, 18권 3호, 317-323

권상희·강영희 (2003). 인터넷 미디어의 상호작용성이 라디오 방송 제작방식에 미치는 영향 연구, <사이버커뮤니케이션학보>, 11호, 5-44.

김광재·은혜정 (2013). 라디오 이용자의 만족도 형성에 관한 연구: 상호작용성을 중심으로, <방송통신연구>, 83호, 41-73.

김선화·남일성·김지희·김태환·김동림 (2020). 한국형 소셜로봇 효돌이 지역사회 거주 독거노인의 우울증상과 삶의 질에 미치는 영향, <한국노년학> 40권 5호, 1021-1034.

김성환 (2018). 무선에 밀린 유선 이어폰.. 국내 점유율 절반 이하로, <파이낸셜뉴스>, 2018. 11. 4, http://www.fnnews.com/news/201811041706236533.

김영희 (2002). 일제시기 라디오의 출현과 청취자, <한국언론학보>, 46권 2호, 150-183.

김재원 (2018). 소셜미디어에서의 한국사 콘텐츠 생산과 판매: 팟캐스트와 유튜브를 중심으로, <한국사연구>, 183호, 1-35.

김정현·최준호 (2018). 대화형 에이전트의 추천 전략이 음성쇼핑경험에 미치는 영향에 관한 연구, <사이버커뮤니케이션학보> 35권 4호, 5-35.

김지완 (2020). 네이버, NHN, ‘오디오 콘텐츠’에 승부수... ‘유튜브 대항마’ 급부상, <뉴스핌>, 2020. 6. 19.

문선영 (2012). 1950-60년대 라디오 방송극과 청취자의 위상, <한국극예술연구> 35집, 189-219.

박근서 (2012). 소통환경의 변화와 복잡계 이론: 사회변동에 대한 새로운 패러다임의 모색, <커뮤니케이션이론> 8권 2호, 65-89.

박수아·최세정 (2018). 인공지능 스피커 만족도와 지속적 이용의도에 영향을 미치는 요인: 기능적, 정서적 요인을 중심으로, <정보사회와 미디어>, 19권 3호, 159-182.

박일호 (2008). 매체의 전환, 미적 경험의 확장, <현대미술학논문집>, 2008년 12월, 259-194.

반명진·김영찬 (2016). 공동체 라디오와 지역 공동체 구성원의 상호작용에 대한 현장연구: 마포 FM 사례를 중심으로, <한국언론정보학보>, 78호, 79-115.

동아일보, 1956년 5월 14일, 3면, “와~ 활동사진이 붙은 라디오다”

동아일보, 1933년 11월 2일, 6면. 토키의 소리와 라디오의 소리.

백미숙 (2007). 라디오 사회문화사, 한국언론재단 (편). <한국의 미디어 사회문화사>(307-382쪽), 서울: 한국언론재단.

서요성 (2017). 인신과 문화의 맥락에서 미디어의 고찰: 마샬 맥루언의 감각, 말, 글 개념에 대한 비판적 독해, <독일언어문학>, 77집, 249-271.

서재길 (2006). ‘공기’와 ‘연극’: 초기의 라디오 예술론에 관한 소고, <한국문화> 38호, 113-135.

안민호 (2009). 시청행위의 복잡계적 특성에 관한 연구, <언론과사회> 17권 3호, 116-150.

안하늘 (2017). 폰으로 라디오 청취... LG전자부터 한·미 선제 적용. <아시아경제>, 2017년 8월13일. Retrieved from http://www.asiae.co.kr/news/view.htm?idxno=2017081310435790193

원만희 (2002). 매체와 지각: 마샬 맥루언의 매체론에 대한 철학적 논평, <철학과분석>, 5호, 135-155.

윤호영 (2019). 팟캐스트 방송 생태계의 진화: 다양성 변화, 경쟁 및 생존, <한국방송학보>, 33권 4호, 146-185.

이기형·김태영·김지수·박휘서·유동림 (2013). 청년세대가 진단하는 정치·시사분야 팟캐스트 프로그램의 역할과 함의: <나는 꼼수다>의 사례를 중심으로, <언론과사회>, 21권 4호, 46-106.

이내수 (2001). <이야기 방송사>, 서울: 씨앗을뿌리는사람들.

이동후(2010). 제3의 구술성: ‘뉴뉴미디어’ 시대 말의 현존 및 이용 양식, <언론정보연구>, 47권 1호, 43-76.

이상길 (2001). 유성기의 활용과 사적 영역의 형성, <언론과사회> 9권 4호, 49-95.

이승원 (2005). <소리가 만들어낸 근대의 풍경>, 서울: 살림.

이재현 (2007). 멀티미디어로서의 ‘보이는 라디오’: 재매개, 다중감각양식, 그리고 미디어 경험, <언론과사회>, 15권 3호, 71-95.

이재현(2005). DMB의 인터페이스, 시공간성, 그리고 모바일 상호작용. 《방송문화연구》 제17-1호, 75-100.

이재현 (2003). 멀티미디어와 문화 인터페이스, <언론정보연구> 40호, 135-165.

이정기 (2018). 팟캐스트 이용동기, 평가(저널리즘 가치평가, 만족도)가 팟캐스트 지지의도에 미치는 영향, <방송과커뮤니케이션>, 19권 4호, 117-157.

이호준·최명일·박성복·황하성 (2008). 시사토크 라디오의 청취 효과: 라디오 청취동기, 의사인간관계, 이슈태도의 관계. <방송과커뮤니케이션>, 9권 1호, 159-184.

이희랑·김희영 (2017). 마을미디어 실천에 대한 탐색적 연구. <한국언론정보학보>, 81호, 75-121.

임종수 (2009). 쇼를 하라: 영상 모바일 커뮤니케이션 연구, <언론과사회> 17권 4호, 2-47.

임종수 (2004a). 한국방송의 기원: 초기 라디오 방송에서 제도, 편성, 장르의 형성과 진화. <한국언론학보>, 48권 6호, 370-396.

임종수 (2004b) 1960-70년대 텔레비전 붐 현상과 텔레비전 도입의 맥락. <한국언론학보>, 48권 2호, 79-107.

임종수 (2006). 방송 미디어와 근대적 시간의 구조화에 관한 연구. <언론과사회>, 14권 3호, 4-34.

임종수 (2010). 수용자의 탄생과 경험: 독자, 청취자, 시청자. <언론정보연구> 47권 1호, 77-120.

임종수·최세경 (2016). 디지털TV에서의 수용경험과 순환에 관한 연구: 가족TV, 개인TV, 우리TV, 나의TV, <방송과커뮤니케이션>, 17권 4호, 5-52.

임종수 (2018). 오토마타 미디어: AI미디어의 커뮤니케이션 양식을 위한 시론. <언론과사회> 26권 4호, 33-84.

임종수·최진호·이혜민 (2020). AI 미디어와 의인화: AI 음성 대화형 에이전트의 의인화 평가척도 개발 연구, <한국언론학보>, 64권 4호, 436-470.

임종수·선지원 (2022). 인터넷 모델의 기원과 플랫폼 정보 서비스 규제 프레임 연구: OTT 제도화에 대하여, <방송통신연구> 2022년 특집호, 123-156.

장은미·허솔 (2022). 여성들의 놀이터, 일상의 경험이 공유되는 새로운 방식: 팟캐스트 <송은이&김숙 비밀보장>을 중심으로, <미디어, 젠더&문화>, 37권 1호, 111-153.

정지희 (2013). 전시기 일본의 라디오 방송과 대중의 국민화, <동양사학연구>, 125집, 367-403

조선일보, 1924년 10월 6일, 4면, 편리한 무선전화.

조선일보, 1927년 1월 16일, 2면, ‘라디오’로 활동전송.

조선일보, 1923년 4월 24일, 3면, 세계를 좌관하는 기계.

주창윤 (2011). 1960년대 전후 라디오 문화의 형성 과정, <미디어경제와문화>, 9권 2호, 7-43.

최인규 (1976). TV시대의 라디오, <신문평론>, 1976년 6월호, 86-88.

최창봉․강현두 (2001). <한국문화예술총서 11: 우리방송 100년>, 서울: 현암사.

현대원·박창신 (2004). <퍼스널 미디어>, 서울: 디지털미디어리서치.

황유선·송인덕·김재선 (2014). 라디오 청취 유형에 따른 라디오 이용과 인식의 차이, <한국방송학보>, 28권 2호, 249-285.

Bolter, J. & Grusin, R. (1999). Remediation: Understanding new media. Cambridge, MA: The MIT Press.

Bourdieu, P. (1979), La Distinction: Critique Sociale du Jegement, 최종철 역(1995), <구별짓기: 문화와 취향의 사회학 上>, 새물결.

Buchanan, M. (2007). The social atom, New York: Bloomsbury, 김희봉 역 (2010). <사회적 원자>, 사이언스북스.

Cannon, R. (2003). The legacy of the Federal Communications Commission’s computer inquires, Federal Communications Law Journal, 55(2), 167-206.

Downey, A. B. (2012). Think complexity, O’Reilly Media Inc., 이제원 역 (2016). <복잡계와 데이터 과학>, 홍릉과학출판사. 

Ellis, J. (1982). Visible fictions: Cinema, television, video, London & New York: Routledge.

Guliciuc, V. (2014). Complexity and social media, Procedia – Social and Behavioral Sciences, 149, 371-375.

Hayles, N. K. (1999). How we became posthuman: virtual bodies in cybernetics: Literature and informatics, Chicago and London: University of Chicago Press.

Hirschmeier, S. & Beule, V. (2021). Characteristics of the classic radio experience perceived by young listeners and design implication for their digital transformation, Journal of Radio & Audio Media, 28(2), 231-253.

Hoffman, R. (2008). Exploring the link between uncertainty and organizing processes: Complexity science insights for communication scholars, Communication Theory, 18(3), 426-447.

Hura, S. L. (2008). Voice user interfaces, In Kortum, P. (Ed.). HCI beyond the GUI: Design for haptic, speech, olfactory, and other nontraditional interfaces (pp.197-229), San Francisco, CA: Morgan Kaufmann.

Johnson, N. (2007). Simply complexity, 한국복잡계학회 (역) (2015). <복잡한 세계 숨겨진 패턴>, 바다출판사.

Johnson, P. (2016). Editors remarks: Saving radio-The cultural value of preserving sound, Journal of Radio & Audio Media, 23(2), 195-196.

Kennedy, H. (2008). New media’s potential for personalization, Information, Communication & Society, 11(3), 307-325.

Lim, J. (2017). The 4th Industrial Revolution and the emergence of algorithmic media: Changes in media form and cultural shock, New Physics: Sae Mulli, 67(5), 530-541.

Manovich, L. (2001). The language of new media, Cambridge, MA.: MIT Press.

Manovich, L. (2013). Software takes command, New York, NY: Bloomsbury Academic

McLuhan, M. (1964). Understanding of media: The extensions of man, Cambridge, Mass.: The MIT Press.

McLuhan, M. (1967). The medium is the massage: The inventory of effects, New York: Bantam Books.

Morley, D. (2003). What's 'Home' got to do with it?: Contradictory dynamics in the domestication of technology and the dislocation of domesticity. European Journal of Cultural Studies, 6(4), 435-458.

Ong, W. (1982). Orality and literacy, New York, NY: Routledge.

Ortega, F. (2012). Complexity and communication 3.0, World Futures, 68(4-5), 273-279.

Penrose, R. (1989). The Emperor’s new mind: Concerning computers, minds and the laws of physics. Oxford: Oxford University Press. 박승수 (1996). <황제의 새 마음: 컴퓨터, 마음, 물리법칙에 관하여>, 이화여자대학교 출판부.

Qvortrup, L. (2006). Understanding new digital media, medium theory or complexity theory?, European Journal of Communication, 21(3), 345-356.

Savar, A. (2013). Social media is a complex system, In Content to commerce: Engaging consumers across paid, owned, and earned channels(Ch.3), New Jersey: Wiley.

Shepperd, J., Keeler, A. & Sterling, C. (2016). Sound recognition of historical visibility: The radio preservation task force of library of congress: Introduction, Journal of Radio & Audio Media, 23(2), 229-232.

Searle, J. R. (1987). Minds and brain without programs, In C. Blackmore & S. Greenfield (Eds.). Mindwaves: Thoughts on intelligence, identity, and consciousness(pp.209-234), Oxford: Basil Blackwell.

Spigel, L.(2001). Media homes: Then and now. International Journal of Cultural Studies 4(4), 385-411.

Urry, J. (2005). The complexity turn, Theory, Culture & Society, 22(5), 1-14.

Vargo, S. L. & Lusch, R. F. (2004). The four service marketing myths: Remnants of a goods-based, manufacturing model, Journal of Service Research, 6(4), 324-335.

Wiener, N. (1948). Cybernetics: or control and communication in the animal and the machine. Cambridge, MA: MIT Press.

Williams, R. (1977). Marxism and Literature, Oxford: Oxford University Press.     


#청각 미디어, #인터페이스, #AI


Source: 디지털 미디어 시론: 청각 미디어의 디지털화와 그 인터페이스, <방송문화연구>, 34권 2호, 47-80.

매거진의 이전글 3부인터넷 모델의 기원과 플랫폼 정보서비스 규제 프레임
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari