brunch

과거와 현재의 내비게이션 안내 음성 제작 변천사

by 아이나비시스템즈
맵스플랫폼 사업팀_브런치 (25).png



Ep.25


면허를 따고 처음 운전대를 잡았을 때를 떠올려 보세요. 길은 모르는데 차들은 옆에서 끼어들고 긴장해서 내비게이션이 시야에 들어오지 않는 그때 들려오는 한 줄기 빛과 같은 소리.


“잠시 후, 우회전입니다.”


이 짧은 한 문장이 주는 안도감은 운전을 처음 시작해 본 사람이라면 누구나 공감할 수 있을 겁니다. 이처럼 단순한 정보 전달 이상의 역할을 하는 것이 바로 내비게이션의 안내 음성입니다. 오늘은 이 안내 음성이 어떻게 만들어졌고, 지금은 어떤 방식으로 진화하고 있는지를 함께 살펴보려 합니다.



안내 음성은 어떻게 구성되어 있을까?


아이나비 내비게이션의 안내 음성은 크게 기본 음성방면 음성 두 가지로 나뉩니다. 먼저, 우리가 운전 중 가장 자주 듣는 다음과 같은 문장들은 기본 음성에 해당합니다.


“잠시 후, 좌회전입니다.”

“300m 전방, 시속 50km 과속 및 신호 단속에 주의하세요.”

“전방에 과속방지턱이 있습니다.”


기본 음성거리, 방향, 동작, 안전 운행 등 운전에 필요한 핵심 정보를 담고 있으며, 운전자가 언제, 어디서, 어떻게 행동해야 하는지를 직관적으로 안내해 주는 역할을 합니다. 그러나 이러한 안내 문장은 주행 상황에 따라 다양하게 변화하기 때문에 모든 문장을 완성된 형태로 하나하나 녹음하고 저장하는 것은 매우 비효율적입니다. 따라서 문장을 단어 또는 시나리오 단위로 분리한 뒤, 인덱스별로 관리하여 필요한 상황에 맞춰 조합하는 방식으로 유연하고 효율적인 음성 안내 시스템을 구현하고 있습니다.


“300m 전방” / “시속” / “50km” / “과속 및 신호 단속에 주의하세요.”

“하이패스 차선은” / “1” / “2” / “차로입니다.”


하지만 기본 음성만으로는 안내가 부족한 경우도 있습니다. 예를 들어 고속도로 분기점이나 복잡한 교차로처럼 갈래가 여러 개인 구간에서는 단순히 “좌회전입니다.”만으로는 정확한 방향을 인지하기 어려운 경우가 많습니다.


1. 좌회전 경로가 2곳이라 방향을 정확히 인지하기 어렵다.png 좌회전 경로가 2곳이라 방향을 정확히 인지하기 어렵다.

이런 상황에서 사용되는 것이 방면 음성입니다. 방면 음성지명, 고유명사, 도로명 등과 같은 정보를 전달하며, 기본 음성을 보완해 운전자에게 더 구체적인 방향 정보를 제공합니다. 예를 들면, 다음과 같은 단어들이 방면 음성에 해당합니다.


"판교”

“경부고속도로”

“인천공항”


이러한 방면 음성은 아래와 같이 상황에 따라 기본 음성과 조합되어 하나의 안내 문장으로 운전자에게 전달됩니다.


“300m 전방, 삼평 사거리에서 동판교 IC 방면 좌회전입니다.”
“잠시 후, 판교 IC 방면 좌회전입니다.”



과거의 음성 제작 과정과 한계점


내비게이션 안내 음성이 운전자에게 전달되기까지는 여러 단계를 거치는 제작 과정이 필요합니다. 먼저, 안내 서비스에 필요한 다양한 상황을 시나리오로 정리한 후 그에 맞는 음성 리스트를 작성합니다. 특히, 새로운 음성이 기존 음성과 조합될 때 어색하지 않도록 앞뒤 문장을 덧붙여 자연스럽게 연결되는 형태로 대본을 구성합니다.


2. AI 생성 이미지.png 출처 : ChatGPT (AI 생성 이미지)

그다음, 음색과 전달력 등을 고려해 적절한 성우를 선정하고 전문 스튜디오에서 대본에 따라 녹음을 진행합니다. 녹음이 끝나면 음성 파일에 필요한 부분을 추출 및 편집하고 음질을 보정하는 작업이 이뤄집니다. 이렇게 완성된 음성 파일은 내비게이션 시스템에 적용되어, 운전자가 실제로 주행 중에 듣게 되는 안내 음성으로 제공됩니다.


3. 음성 제작 및 적용 과정.png 음성 제작 및 적용 과정

이와 같은 과정을 통해, 우리가 운전할 때 듣는 익숙하고 안정적인 내비게이션 안내 음성이 만들어지게 됩니다. 이러한 제작 방식은 일정 수준의 품질을 보장했지만, 다음과 같은 한계점이 존재했습니다.


새로운 음성을 추가할 때 말투나 음색의 차이로 인해 이질감이 발생

성우 섭외와 녹음에 많은 시간과 비용이 소요

변경된 도로 정보나 안내 문구를 즉시 반영하기 어려움

서비스의 유연성과 확장성에 제약이 있음


결과적으로, 기존의 성우 녹음 기반 음성 제작 방식만으로는 늘어나는 사용자 요구와 빠르게 변화하는 서비스 환경에 기민하게 대응하기에는 어려움이 있었습니다.



TTS의 도입


이러한 한계를 해결하기 위해 아이나비는 ‘TTS(Text-to-Speech)’ 기술을 도입하였습니다. TTS는 ‘Text-to-Speech’, 즉 문자(text)를 음성(speech)으로 변환하는 기술로, 사람이 직접 녹음하지 않아도 텍스트만 입력하면 컴퓨터가 자연스러운 음성을 자동 생성할 수 있습니다.


덕분에 다양한 문장을 빠르게 만들어낼 수 있을 뿐 아니라, 항상 동일한 톤과 속도로 음성이 출력되므로 기존 음성과의 이질감 문제도 크게 줄일 수 있게 되었습니다.


4. 지미애 성우 음성 TTS Demo.png 출처 : 자사 TTS 프로그램 (지미애 성우 음성 TTS Demo)

특히 그동안 부드럽고 안정적인 톤으로 많은 사랑을 받아온 지미애 성우님의 녹음 데이터를 기반으로 TTS 음성 학습을 진행하여, 새로운 기본 음성과 방면 음성을 신속하고 안정감 있게 생성할 수 있게 되었습니다.


5. TTS 생성 플랫폼.png 출처 : 각 TTS 생성 플랫폼

또한, 고객의 다양한 니즈를 반영하여 새롭게 성우를 섭외하거나 녹음하지 않고도 TTS 생성 플랫폼을 활용해 개성 있는 음성을 손쉽게 추가할 수 있었습니다.


이를 통해 현재 ‘아이나비AIR’에서 다양한 스타일과 톤을 가진 안내 음성을 선택하여 들을 수 있게 되었습니다.



앞으로의 안내 음성은 어떻게 발전할까?


앞으로의 안내 음성은 단순한 길 안내를 넘어서, AI와 결합된 지능형 주행 파트너로 진화할 것입니다. AI가 운전자의 주행 습관·성향·시간대·도로 상황을 실시간으로 분석해, 말투·속도·어휘를 조절한 개인 맞춤형 음성을 제공하게 되겠죠.


예를 들어, 과속이 잦은 운전자에겐 단호한 어조로 경고하고, 초보 운전자에겐 더 부드럽고 천천히 안내하는 식이죠. 더 나아가, 운전자는 자신의 취향에 맞는 음색이나 말투를 직접 선택해 더욱 자연스럽고 몰입감 있는 주행 경험을 누릴 수도 있을 것입니다.


이처럼 내비게이션 안내 음성은 점점 더 개성 있고 감정에 공감하는 존재로 발전하여 운전자의 상황을 이해하고 반응하는 진정한 맞춤형 동행자로 자리매김하게 될 것입니다.



마치며


“잠시 후, 우회전입니다.”


이 짧은 한마디는 누군가에게 단순한 정보이지만, 또 다른 누군가에게는 긴장된 순간을 이겨내게 해주는 신뢰의 목소리입니다. 기술이 아무리 발전해도 그 중심에는 운전자와 함께 길을 나서는 동행자의 마음이 있습니다.


‘아이나비시스템즈’는 앞으로도 운전자의 안전과 편의를 최우선으로 생각하며, 언제 어디서든 믿고 따를 수 있는 내비게이션 안내 음성으로 길 위의 든든한 파트너가 되겠습니다.


by 아이나비시스템즈 모빌리티Map1팀 김석중


iMPS배너_최종수정_하얀색.png

국내 가격 경쟁력 1위! 아이나비가 만든 차별화된 지도 솔루션, iMPS 바로가기


#내비게이션 #내비게이션안내 #TTS #아이나비에어 #아이나비내비게이션 #지도 #아이나비시스템즈

keyword
작가의 이전글PythonUnittest 활용 테스트 코드 작성가이드