understanding characteristics of sound
음반 제작을 위한 녹음, 믹싱, 마스터링 과정과 라이브 상황에서 소리를 다룬다는 말에서 '소리'는 단순히 어떤 '현상' 혹은 '물체'를 다룬다는 의미를 넘어 사람의 뇌가 어떻게 '소리'를 인지하고 해석하는지 '02 소리 전달 과정'에서 알아보았다. 이번 장에서는 물리적 현상인 '소리' 그 자체의 특징에 대해서 깊이 알아보고자 한다.
소리는 1. 어떤 물체가 공기 중에서 떨리면(진동하면) 2. 그 물체의 떨림이 공기입자에 전달되고, 3. 공기입자의 진동은 파동의 형태로 모든 방향에 퍼지며 만들어진다. 이는 마치 고요한 연못에 돌을 던지면 물결이 파동의 형태로 퍼지는 것과 비슷하다. 사람은 공기의 파동 즉 공기압의 주기적 변화를 소리로 인지한다. 일기예보에서 말하는 고기압, 저기압과 같은 공기압의 변화이지만, 사람이 인지할 수 있으려면 변화의 주기가 이보다는 빨라야 한다. 사람은 공기압 변화의 폭이 크면 큰소리로 변화의 주기가 빨라지면 고음으로 인지한다.
연못 물은 물의 입자가 모여 있는 것과 같이 공기 중에는 공기를 구성하는 입자가 있다. 공기 중에서 진동하는 물체는 주기적으로 앞뒤로 (혹은 위아래로) 흔들리며 공기의 입자를 밀어내는데 진동하는 물체가 공기의 입자를 밀어내는 순간 공기는 압축되고 후퇴하면 공기가 희박해진다. 이 파동은 공기 입자가 멀리 이동하는 것이 아니라 진동 에너지가 파동의 형태로 공기 입자에서 입자로 전달하는 현상이다. 이는 마치 경기장에서 관중들이 파도타기를 하는 것과 같이 사람들의 수직적인 움직임이 옆으로 전달되며 거대한 인간 파도가 만들어지는 것과 같은 착각을 일으키는 것과 흡사하다.
사람이 소리를 듣는 과정을 보면 먼저, 공기 중에서 어떤 물체가 흔들리고 이 흔들림(진동)에 의해 공기 입자의 밀도가 주기적으로 증가하고 감소하는 파동이 사람의 귀로 전달된다. 청각기관과 청각세포가 공기의 파동을 진동으로 그리고 진동을 전기로 변환하여 뇌에 전달하면 뇌는 전달된 전기신호를 소리로 인식 혹은 해석하는 것이다.
물론 물체의 떨림은 공기뿐 아니라 물이나 금속과 같은 고체로 전달되지만 공기를 통해서 전달되는 물체의 진동이 음향전문가에게 가장 중요하며 고체를 통해서 전달되는 진동은 차음이나 흡음등의 방음에 중요한 부분이다. 예를 들어 책상 위에 스피커를 설치할 때 방진패드를 사용하는 이유 역시 스피커의 진동이 책상(고체)을 통해 듣는 이에게 전달되어 귀로 들리는 소리에 영향을 미치기 때문이다.
소리의 물리적 특징은 강도(진폭) amplitude, 주기 frequency, 속도 velocity, 길이 wavelength, 위상 phase, 배음분포 harmonic content, 소리형성의 형태 envelope의 조합으로 나타난다. 소리의 각 요소와 연관된 특징과 수치를 이용해 소리를 조정하기 때문에 요소에 대해 이해하는 것은 음향 엔지니어가 원하는 방향으로 소리를 조정하는데 중요한 배경 지식이 된다.
소리의 강도는 공기압의 변화정도를 나타내는 것으로 공기압이 전기로 변환되었을 때는 전기압의 변화량을 소리의 강도라 말할 수 있다. 일반적으로 소리의 강도는 아주 빠르게 변화하는데 사람은 순간적인 변화를 인지하지 못하고 어느 정도 시간(여전히 아주 짧은 시간이다)이 지나야 소리의 크기를 평균값으로 인지한다.
위의 그림은 소리의 강도를 설명한 것으로 피크 레벨, 피크에서 피크 레벨, 그리고 실효치 rms 레벨을 나타낸 것으로 음향장비나 음향 프로그램에서 미터 meter 를 통해 입력 혹은 출력되는 전기신호의 강도를 알 수 있다. 피크 레벨은 소리의 순간 강도의 변화를 알 수 있고 실효치 rms레벨은 사람이 소리의 크기를 인지하는 것과 비슷한 방식으로 표시되기 때문에 이 두 가지의 레벨을 보면서 입력 혹은 출력 신호의 레벨을 조정할 수 있다.
* 피크 레벨 peak level
* 실효치 레벨 rms level
소리의 진동수인 주파수는 물체가 1초에 몇 번 진동하는지 나타내는 수치이다. 초당 진동수에 따라 소리의 높낮이가 바뀌는데 진동수가 낮으면 저음으로 높으면 고음으로 인지한다. 단위로는 Hz(hertz) 혹은 CPS(cycle per second)를 사용한다. 진동수가 높아지면 음은 높아지고 파장은 짧아지며 진동수가 낮아지면 음은 낮아지고 파장은 길어진다.
사람이 들을 수 있는 가청주파수는 20Hz에서 20,000Hz로, 대부분의 전문용 음향장비가 표현 혹은 처리할 수 있는 주파수 범위가 20~20,000Hz인 이유이다. 진동 횟수가 2배 증가하면 한 옥타브 높은 소리로 들리고 반대의 경우는 한 옥타브 낮은 소리로 들린다. 20Hz를 시작으로 가청주파수는 10개의 옥타브로 구성되어 있는데 주파수는 소리를 다루는데 중요한 단위로 음색을 조정하는 이퀄라이저를 사용하는데 필요하다. 들리는 소리와 주파수 단위의 연결은 오디오 청음 훈련을 통해 가능한데 이 훈련을 통해 주파수 수치를 조정하면서 음색을 바꾸는 것이 가능해진다.
소리가 공기 중에서 진행하는 속도는 초당 약 340m이며 온도의 변화에 따라 조금씩 달라진다. 정확하게 이야기하자면, 음속 340m/s는 온도 15도의 경우이고 온도에 따라 소리의 속도는 달라지는데 온도가 1도 올라가면 초속 약 0.6m가 더 빨라지고 1도 내려가면 초속 0.6m가 느려진다. 음속 자체는 물리현상으로 음색과 별 연관이 없는 듯 하지만 하나 이상의 소리가 동시에 발생할 때 그리고 하나의 음원에 두 개 이상의 마이크를 사용하게 되면 소리가 서로를 간섭하는 현상이 만들어지면서 음질 혹은 음색에 영향을 미칠 수 있다.
파장의 길이는 주파수에 따라 달라진다. 주파수가 낮으면 파장의 길이는 길어지고 주파수가 높으면 파장의 길이는 짧아진다. 상온(15도)에서 소리가 초속 340미터 그러니까 1초에 340m 진행하니 1초에 1번 진동하는 주파수의 길이는 340m가 된다. 1초에 한번 진동하는 주파수는 1Hz이며 1Hz의 길이는 340m이다. 그럼 1초에 10번 진동하는 10Hz의 길이는 무엇인가? 1초에 10번 진동하면 10Hz의 파장의 길이는 1Hz의 1/10이 된다. 그러므로 10Hz의 파장의 길이는 1Hz의 파장의 길이 340m의 1/10인 34m가 된다.
사람이 들을 수 있는 주파수의 시작인 20Hz의 파장의 길이를 구해 보면 다음과 같다. 20Hz는 1초에 20번 진동하므로 340m 나누기 20을 하면 17이 나온다. 20Hz의 파장의 길이는 17m이다. 간단한 암산을 하면 200Hz의 길이는 1.7m, 2,000Hz의 길이는 0.17m, 17cm, 20,000Hz의 길이는 1.7cm 정도가 된다.
소리의 파동은 빛이나 물결과 같이 단단한 물체나 벽을 만나면 반사하는 특징이 있다. 반사각은 표면의 모양에 따라서 달라지는데 평평한 모양이면 들어온 각도 그대로 규칙적으로 반사되지만 모양이 달라지면 모양에 따라 난반사가 일어난다.
소리의 반사로 인해 만들어지는 그 대표적인 현상은 메아리(에코)나 울림(잔향)이 될 것이다. 또한 소리의 반사는 음질에 영향을 미치기도 하는데 딱딱한 표면에 반사된 소리가 직접음에 영향을 미치거나 소리가 한 곳에 모여 특정 주파수가 많아서 웅웅거리는 현상이 만들어지기도 한다. 반사음을 컨트롤하기 위해 벽면의 모양이나 재질을 다르게 하여 소리를 흡수하거나 난반사를 만들어 울림을 줄이거나 좋게 만드는 것이 음향 설계이다.
장애물이 없는 상태에서 소리는 직진하지만, 장애물보다 긴 소리 파동이 그 장애물과 부딪치면 소리 파동은 장애물을 따라 회절 한다. 또한 소리 파동보다 작은 틈이 있다면 소리 파동은 작은 틈을 통해 회절 하며 전달된다.
사람이 소리의 위치를 파악할 수 있는 이유는 왼쪽 귀와 오른쪽 귀로 전달되는 소리 정보의 차이 때문이다. 사람의 머리 폭 보다 짧은 파장의 길이를 가진 주파수는 회절 하지 않고 소리의 음영을 만들어 왼쪽 귀와 오른쪽 귀에 다른 주파수(음색)를 가진 소리를 전달하고 사람의 머리 폭보다 큰 파장을 가진 주파수는 회절 하며 다른 음압을 머리폭만큼의 시간차를 두고 전달하며 소리의 위치를 알 수 있게 한다.
사람 머리의 반지름이 약 28cm라고 가정했을 때 사람의 머리 반지름보다 짧은 주파수인 1,200Hz보다 높은 주파수들은 소리의 음영이 생기고 1,200Hz 보다 낮은 주파수들은 머리 반지름만큼인 28cm 정도를 더 진행하여 다른 쪽 귀에 도달하니 약 0.8ms (1000ms = 1초) 정도의 시간차가 생길 것이다.
https://www.quora.com/How-can-you-tell-if-two-microphones-are-out-of-phase-with-each-other-How-can-you-fix-it-if-they-are, https://goodtopssm.life/product_details/88771690.html,
소리의 위상은 소리 파동의 진폭이 시간에 따라 어떻게 달라지는지 나타내는 것으로 일반적으로 사인파 sine wave로 나타낸다. 위상은 소리 파동이 얼마나 빨리 혹은 느리게 반복 되지를 나타낼 수 있고 얼마나 강하거나 약하게 반복되는지도 나타낼 수 있다.
소리의 위상은 위상 간섭현상을 통해 설명하는데 이론상으로 보면 파동의 시작과 진동수 그리고 진폭이 같은 두 주파수가 합쳐지면 진폭이 2배로 커지고 진동수와 진폭은 같지만 파동의 시작이 180도 어긋나 있다면 소리가 완전히 상쇄된다. 그리고 진동수와 진폭이 같은 주파수가 약간 어긋나 있다면 어긋난 정도에 따라 진폭을 왜곡시킨다. 그리고 다른 파장을 가진 주파수가 서로 간섭하게 되면 또 다른 형태를 가진 파형이 만들어진다. 현장에서 위상간섭현상을 완전히 통제하는 것은 불가능하지만 이를 이용하거나 최소화하는 형태로 사용할 수 있다.
우리가 듣는 대부분의 서양 악기소리는 기본음과 고조파 高調波 harmonic, overtone이 합하여진 소리이다. 고조파는 기본음 위로 높이(고高) 맞추어진(조調) 주파수(파波)란 뜻으로 서양 음계와 음향의 근간이 된다. 음향에서 하모닉 Harmonic은 기본음을 1차 배음(x1)으로 보고 기본음의 2배(x2)가 되는 주파수를 2차 배음, 3배(x3)가 되는 주파수를 3차 배음의 순서로, 정수에 비례하여 증가하는 것으로 보고 있으며 오버톤 overtone은 기본음 위에 나타나는 다양한 주파수를 가리키지만 이를 혼용해서 사용하기도 한다. 중요한 점은 하모닉이나 오버톤 중 어떤 이름을 사용하더라도 가리키는 것이 무엇인지 인지해야 할 필요가 있을 것이다.
순수한 사인파와 같은 소리를 내는 악기는 거의 존재하지 않는다. 줄 string의 기본 진동에 배수비로 증가하는 형태의 진동이 추가되거나 파동이 악기의 모양에 따라 공진하여 배음이 추가되며 배음의 구성이 달라져 각 악기의 특색 있는 소리가 만들어진다. 현악기나 관악기와 같이 규칙적인 정수 배음의 분포가 많은 악기도 있고 벨, 실로폰, 타악기와 같이 불규칙적인 오버톤을 가지는 악기도 있다. 한국 전통악기나 동양, 중동의 전통악기들은 불규칙적인 오버톤을 가지고 있다.
어쨌든 배음은 홀수배의 홀수배음과 짝수배의 짝수 배음으로 나눌 수 있는데 짝수 배음 even harmonics은 기본주파수의 2배, 4배, 6 배등의 정수배 주파수를 말하고 소리를 풍성하고 명확하게 만드는 특징이 있고 홀수배음 odd harmonics은 기본음의 3배, 5배, 7 배등의 정수배 주파수를 가리키고 짝수배음 보다는 덜 하기는 하지만 풍성함을 더해주고 소리를 힘 있게 만들어주는 특징이 있다. 악기의 특징적인 소리는 짝수 배음과 홀수 배음의 상대적 비율에 따라 나타난다.
같은 음을 연주하더라도 배음의 구성에 따라 악기소리는 달라지며, 배음의 구성은 악기의 모양과 재질에 따라 다르게 확산되기도 한다. 악기의 구조와 특성에 대한 이해가 깊을수록 악기 소리에 대한 이해도 높아지겠지만, 모든 악기의 구조와 특성을 짧은 기간에 다 숙지하기는 어렵다. 소리를 잘 다루기 위해서는 악기에 대한 공부와 함께, 보다 중요한, 좋은 악기소리를 많이 듣고 귀를 훈련하여 소리에 대한 분별력을 키우는 노력을 게을리하지 말아야 할 것이다. 음향 장비 역시 구성부품에 따라 짝수 배음을 추가되느냐 혹은 홀수 배음이 추가되느냐에 의해 음색이 결정되기도 한다. 이 점에 대해서는 차후 마이크, 마이크 프리앰프, 세추레이션에서 보다 자세히 다루도록 하자.
배음의 구성과 함께 음색을 결정하는 핵심 요소는 소리의 엔벨로프 envelope이다. 한국어로 바꿀 수 있는 단어가 없기 때문에 '엔벨로프'를 사용하기로 하자. 소리의 엔벨로프는 시간이 지남에 따라 소리의 진폭이 어떻게 바뀌는지 보여주며 악기의 음색이 다른 악기와 어떻게 다른지 알 수 있게 한다.
엔벨로프를 설명할 때 ADSR을 사용하는데 A는 attack, D는 decay, S는 sustain, R은 release이다.
Attack (A) : 어택은 소리가 발생할 때 최대 레벨에 이르는 시간을 나타낸다.
Decay (D) : 디케이는 소리가 최대 레벨에 도달한 후 얼마나 빨리 서스테인 레벨로 떨어지는지를 나타낸다.
Sustain (S) : 서스테인은 소리가 어느 정도 일정한 강도를 유지하는 지점을 나타낸다.
Release (R) : 릴리즈는 서스테인 이후 소리가 사라지기까지의 시간을 나타낸다.
트롬본의 엔벨로프를 보면 어택이 크래쉬 심벌이나 스네어 드럼에 비해 완만하게(느리게) 만들어지고 디케이, 서스테인의 시간도 길게 유지되는 것을 알 수 있다. 크래쉬 심벌이나 스네어 드럼은 빠른 어택을 가지고 있으며 어택, 디케이, 서스테인에 비해 긴 릴리즈가 있는 것이 특징이라 말할 수 있다. 일반적으로 빠른 어택을 가진 소리들이 날카롭게 들리고 느린 어택을 가진 악기들은 부드럽게 들린다. 하지만, 사람은 빠른 어택의 순간적인 강한 진폭의 변화를 통해 소리의 크기를 인지하지 않고 소리의 강도가 어느 정도의 시간 동안 유지될 때 소리의 크기를 짐작할 수 있다. 다른 말로 하자면, 사람은 진폭의 순간 변화인 피크 peak레벨로 소리 크기를 판단하지 않고 진폭의 평균값 RMS를 통해 소리 크기를 판단한다고 말할 수 있다.
그러니까 엔벨로프의 어택 부분은 소리의 크기에 영향을 미친 다기보다는 음색을 구분하는데 더 큰 영향을 미친다고 볼 수 있다. 엔벨로프에서 어택 부분을 음향에서는 트렌지언트 transient라고 부르기도 하는데 이는 마이크와 같은 음향장비의 순간 특성이나 컴프레서와 같이 소리의 진폭 혹은 다이내믹을 다루는 장비의 사용과도 연관이 있으니 기억해 두어야 할 것이다. 또한 마이크의 선택에 따라 같은 악기 소리가 부드럽게 혹은 날카롭게 들리기도 하고 컴프레서와 같은 다이내믹을 컨트롤하는 장비를 사용하여 엔벨로프를 조정하게 되면 음색이 다르게 느껴지기도 한다.
1. 소리의 발생 : 진동과 공기입자
2. 소리의 강도 : 공기압의 변화, Peak, RMS
3. 소리의 진동수 : 주파수
4. 소리의 속도 : 온도 15도, 340m
5. 파장의 길이 : λ = v/f, 100Hz의 길이는?
6. 소리의 반사 : 에코, 잔향
7. 소리의 회절 : 소리 발생 지점의 위치를 파악할 수 있는 이유는?
8. 위상 : 위상 간섭 현상
9. 배음 : harmonic? overtone?
10. 엔벨로프 : ADSR