한국 영화, 드라마를 많이 보는 사람들은 공감할 말일듯하다.
분명 화면에서 배우의 입이 움직이고, 소리가 나오고 있는데 도대체 무슨 말을 하는 건지, 애초에 의미가 있는 말이었는지를 모르겠어 생각하다 다음 대사가 나오고, 심할 경우 작품의 내용을 따라가기조차 힘든 상황도 발생한다.
이런 일이 생기는 이유와 왜 많은 영상 콘텐츠들에서 이 문제를 해결하지 못하는지에 대해 알아보자.
우리가 어떤 사람의 말을 잘 알아듣기 위해 할 수 있는 게 무엇이 있을까?
가장 쉬운 방법은 그 사람에 가까이 다가가는 것일 거다.
물론 목소리가 크게 들리는 것도 영향이 있겠지만 거리가 가까워지면 소리가 잘 들리는 이유가 하나 더 있는데, 바로 '직접음과 잔향의 비율'이다.
딱딱한 콘크리트 벽은 소리를 쉽게 반사한다. 밀폐된 콘크리트 방 안에 혼자 있다고 생각해 보자.
박수를 치면 울리는 소리가 순식간에 모든 빈 공간을 채우는 방, 여기서 울리는 소리는 잔향이다.
하지만 자세히 들어보면 잔향 전, '짝' 하는 깨끗한 소리를 들을 수 있다.
이걸 우리는 '직접음'이라고 부른다.
소리는 직접음이 클수록, 잔향이 작을수록, 그리고 이 둘 사이의 시간이 길수록 깨끗하게 들린다.
보다 쉽게 설명하자면, 우리가 소리의 발생 원인에서 가까우면 직접음이 커지며 깨끗하게 들릴 것이고, 반대로 멀어지면 직접음의 소리가 작아지다 잔향과 비슷할 정도로 들려 소리가 더럽게 들릴 것이다.
또한, 소리의 발생 원인과의 거리가 가깝고 주변의 벽이 멀리 있다면 첫 반사음이 들리기까지 시간이 꽤 오래 걸릴 것이고, 따라서 직접음이 깨끗하게 들릴 것이다.
이걸 영상 오디오에 적용하면, 목소리를 녹음할 때 가능한 마이크를 배우 입 가까이 접근시키는 게 좋다는 결론이 나온다.
하지만 그게 촬영 현장에서 쉬운 일일까?
만약 영상 화면에 녹음할 때 사용된 마이크가 나온다면 이질적인 물체로서 당연히 시선을 끌게 될 것이고 작품에 집중하는 데에 큰 방해가 될 것이다.
이 때문에 촬영에서 붐마이크 같은 동시녹음 장비가 카메라 앞에 들어오는 것에 예민할 수밖에 없는데, 만약 카메라에 마이크가 잡힌다면 당연히 촬영을 다시 해야 할 것이고, 촬영 후에 발견된다면 CG로 지우기 위해 시간, 돈이 소모될 것이다.
결국 붐마이크와 배우의 거리는 어느 정도 있을 수밖에 없다.
두 번째 말을 잘 알아듣게 하기 위한 조건, '작은 소음'이다.
현장에서 녹음할 때 좋든 싫든 대사에 소음이 섞일 수밖에 없다.
작은 소음은 그 목소리의 현장감, 자연스러움에 도움이 되겠지만 대부분의 상황에서 소음은 영상을 감상할 때 작품에의 집중을 방해하는 불필요한 소스로 취급된다.
촬영이 끝나고 후반작업을 할 때 필요하다면 따로 넣을 수 있기도 하고, 이미 배우의 목소리에 섞인 소음을 없애는 게 현재 기술로는 완벽하게 하기 힘들기 때문에 이 없었으면 할 소리는 최대한 낮추는 게 유리하다.
마지막 조건은 조금 생소하게 들릴 수도 있는데, '소리가 충분히 압축되었나'이다.
어떤 사람이 이렇게 말한다고 생각해 보자.
작게
"나는 지금"
그리고 크게
"집에서 나와"
다시 작게
"회사로 가고 있어"
과연 알아듣기 쉬울까?
물론 말을 이해하는데 어려움이 있을 것이고, 이 사람의 목소리 또한 매력적인 것과 거리가 멀게 느껴질 것이다.
이때 필요한 게 '오디오 컴프레션(압축)'이다.
이를 통해 작은 소리를 크게, 큰소리를 작게 조절해 목소리가 일정하게 들리게 할 수 있다.
적당히
"나는 지금 집에서 나와 회사로 가고 있어"
이렇게.
두 번째와 세 번째 말을 잘 알아듣게 하기 위한 조건들, 이 둘을 조절하는 게 어려운 이유는 무엇일까?
두 개를 섞어서 생각하면 쉽게 알 수 있을 것이다.
현장에서 녹음된 목소리와 여기에 들어있는 현장 소음.
들쑥날쑥한 목소리를 일정하게 만들기 위한 컴프레션.
원래 녹음을 아무리 못했더라도 녹음의 대상 (목소리)은 소음보다 크게 들어있기 마련이다.
이런 소리의 문제는 컴프레션을 할 때 나오는데, 비교적 작은 소음은 커지고, 큰 목소리는 작아져 결과적으로는 컴프레션 전보다 소음의 비율이 커지게 된다.
이 때문에 소음이 일정 레벨보다 크게 들어있는 경우에는 컴프레션을 충분히 사용하는 걸 포기할 수밖에 없는데, 이게 많은 영화, 드라마에서 대사가 잘 들리지 않는 큰 이유 중 하나이다.
그렇다면 제작사들은 어떻게 이 문제를 해결할까?
답은 '후시녹음(ADR)'에 있다.
후시녹음은 녹음하다 놓친 부분, 혹은 낮은 녹음 퀄리티 때문에 듣기 어려운 부분들에 사용되는데,
해당 부분을 연기한 배우를 녹음 스튜디오에 불러 같은 대사를 다시 연기하게 해 좋은 목소리를 담아내는 과정을 말한다.
하지만 슬프게도 이 또한 현실적인 문제가 있을 수밖에 없다.
배우의 입장에서, 이미 지나간 연기를 마이크 앞에서 다시 하는 건 쉬운 일이 아니다.
그때의 감정, 목소리의 톤, 말의 속도 등을 촬영 화면을 보며 되살려야 하고, 이렇게 녹음한 소리는 현장에서 수음한 소리에 비해 이질적일 수밖에 없다.
아무리 정교한 편집, 믹싱을 거치더라도 배우의 입 움직입, 행동과 표정을 자세히 살펴보며 들으면 뭔가 이상하다는 걸 느낄 때가 많은 것도 사실이다.
이 때문에 후시녹음은 배우의 카메라 앞뿐만이 아니라 마이크 앞에서의 연기 실력도 필요로 하는데, 이미 후시녹음이 대사의 대부분을 차지하는 외국의 배우와, 비교적 많은 대사가 동시녹음인 한국의 배우들 사이에 후시녹음에 대한 거리감은 차이가 날 수밖에 없다.
물론 모든 소리를 촬영이 끝난 후 스튜디오에서 녹음한다면 깨끗한 음질, 정확하게 들리는 발음으로 인해 대사를 알아듣기가 훨씬 쉽겠지만 과연 이게 항상 좋은 걸까?
현장에서 녹음하는 큰 이유 중 하나는 바로 자연스러움이다.
그 순간 배우의 억양, 발음, 행동에서 나오는 옷소리까지 그때가 아니면 담아내기 불가능한 가장 정확한 소리.
이게 영화나 드라마를 시청하는 우리에게 주는 영향은 무시할 수 없다.
현재 각종 OTT에서 지원하는 한글 자막으로 인해 조금 더 편하게 시청이 가능한 상황에서, 무엇이 더 좋은지에 대한 의견 또한 다양할 것이라고 필자는 생각한다.
사진
-<a href="https://www.freepik.com/free-photo/selective-camera-hand-photographer_29609340.htm#query=film%20making&position=13&from_view=search&track=ais">Image by wirestock</a> on Freepik
-<a href="https://www.freepik.com/free-photo/empty-room-with-lamp_1037316.htm#query=concrete%20room&position=30&from_view=search&track=ais">Image by kues1</a> on Freepik
-Image by <a href="https://www.freepik.com/free-photo/woman-getting-ready-podcast-side-view_25811155.htm#query=voice%20recording&position=26&from_view=search&track=ais">Freepik</a>