brunch

You can make anything
by writing

C.S.Lewis

성문(聲紋)분석이란?

목소리만으로 동일인 화자(話者)를 구분할 수 있을까?

성문이란, 영어로 'Voice Print'라고 합니다. 지문은 'Finger Print'라고 합니다. 손가락 지문처럼 목소리도 눈에 보이는 유사 문양이 있다는 것입니다. 빛을 프리즘으로 나눠서 보듯, 소리도 연산을 통해 다양한 주파수 패턴별로 나누다 보니 사람 목소리에서 특이 문양이 관찰됨을 알게 되어, 이를 비교 분석하게 된 것입니다. 그래서 음성별, 발음마다 특이 문양을 관찰하게 되고, 이를 통해, 다양한 정보를 얻을 수 있게 됨으로써, 오늘날 '성문분석'으로 발전하게 되었습니다.

[출처] KAIST논문 발췌.

Speaker Verification and Identification (Jin, Minho, and Yoo, Chang D.)

Korea Advanced Institute of Science and Technology, Republic of Korea


'성문분석'으로 유추할 수 있는 정보는 성별·나이·지역·학력·언어적 습벽·동일인물 여부 등 다양합니다. 

최근은 그 사람이 가지고 있는 지병까지 추정하는 기술이 개발 중입니다.

그러나, 목소리는 한정된 열 손가락 지문에 비해, 발음·감정기복·음주여부·목상태 등 여러 조건의 변화에 따라 변수가 많아, 그만큼 판독이 어렵고 오차범위가 달라질 수 있다는 단점이 있습니다. 

그래서 동일 화자 판독 감정은 세 가지로 결론화되어 추정됩니다.

   첫째는 동일인으로 추정됩니다.

    - 목소리 분석 결과 동일인일 개연성의 유의미한 데이터가 표출된 경우

   둘째는 다른 사람으로 추정됩니다.

    - 목소리의 각 데이터 비교 분석 결과 동일인일 유사 근거가 부족한 경우

   셋째는 녹취시료가 부정확하여 판독 불가합니다.

    - 목소리 비교 분석에 따른 시료가 제한적이거나 불완전한 경우 

   간혹, 몇 퍼센트(%)라고 공개하는 전문가의 감정 의견이 있을 수 있으나, 사실 주관적 수치일 뿐 공식적인 객관화 표준화된 수치는 아직 없는 것이 현실입니다. 경우에 따라서는 동일인일 가능성을 'High/Medium/Low-probability same person', 다른 사람일 가능성을 ''High/Medium/Low-probability different person'', 그리고 판독불가(불확실한 상황 결론)Uncertainty conclusion', 이렇게 7단계로 좀 더 세분화하기도 합니다.

 

따라서 성문분석 결과 오차범위를 줄이고, 신뢰 수준을 높이는 방법은 최대한 분석시료의 녹취 조건과 동일하게 비교시료를 녹음하여 동일 여부를 분석하는 것입니다. 목소리는 여러 파동의 결합으로 이루어진 소리이므로 작은 변수도 성문분석에 있어서 중요한 포먼트 값의 오차를 유발시킬 수 있기 때문입니다. 물리학에서 보면, 고전역학이 아닌 양자역학에서 불확정성 원리라는 것의 핵심이, 백 억분의 1미터인 크기의 원자 움직임을 정확히 관찰할 수 없는 이유가 원자의 움직임에 영향을 주지 않고 관찰하는 것이 불가하기 때문이라는데, 소리 역시도 인간이 느낄 수 있는 가장 작은 소리세기가 ‘I=10^12 W/m^2’ 이정도 수준인 만큼, 가청 주파수 2만Hz의 주파수까지 더해지면 그 변수 편차가 어마어마하기에 천재 수학자 푸리에가 아니면 불가능했을지도 모릅니다. 그의 편미분 방정식을 푸는 변수분리법을 통해 각기 다른 주파수 파동의 움직임을 포먼트라는 값으로 세분화 패턴화 하여 알 수 있게 되어, 사람의 목소리를 데이터로 분석 가능케 한 것이 '성문분석'의 핵심이기 때문입니다. 그래서 앞서 언급했듯이 이 포먼트 값의 오차 유발 요인을 최소화하는 것이 성문분석의 신뢰 수준을 높이는 것이므로, 특히 녹취시료에 있어서 분석대상자의 음성 외에 타인의 음성이 겹쳐있다거나 라디오나 TV 등과 같이 목소리와 유사한 주파수 소음이 함께 있는 경우는 더욱더 분석이 어렵거나 불가할 수 있습니다. 이런 이유로 단순 2개의 시료로 컴퓨터가 적확하게 분석한다는 것은 현재 기술로는 불가능합니다. 더욱이 분석 전에 분석대상자의 미세한 발화신호를 채집하여야 하는데, 그 데이터 표출까지의 과정에 있어서 매 건마다 변수가 너무 많기 때문입니다. 결국 분석은 해봐야 알 수 있기에 전문가도 분석 전에 결과를 장담할 수 없는 것이 성문분석이며, 상당한 분석경험과 노하우가 필요한 분야라 할 수 있습니다. 또한 성문분석은 분석조건과 도구(tool)에 따라 그 결괏값의 해석이 전문가마다 다를 수 있기에 최종 결론도 오차범위가 큰 시료는 달리 나올 수 있습니다. 그래서 녹취시료(사건시료)와 비교시료를 사전기술분석을 활용한 예비타당성 검토를 통해 대략의 분석 가능성 여부와 오차범위, 신뢰수준 등을 파악하는 것이 좋습니다.

<끝>

이전 05화 음성(음향)분석-잡음제거·목소리 증폭, 그 허와 실!
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari