- EEG 데이터 전처리 -
written by Seungju Lee
seungju.lee@looxidlabs.com
룩시드랩스는 VR과 모바일앱에 뇌전도(EEG)를 접목해 멘탈헬스케어를 돕는 플랫폼을 개발하고 있습니다. 플랫폼 사용자는 EEG 및 광혈류측정(PPG) 센서가 달린 헤어밴드를 이용하여 뇌파를 측정함으로써 인지기능의 저하를 손쉽게 발견하고 스스로 관리할 수 있습니다. 전문가의 도움 없이도 사용 가능한 서비스인 LUCY는 간단하고 재미있는 게임을 하며 실시간으로 뇌파를 측정해 사용자가 자신의 인지기능 상태를 확인 및 관리하게 합니다. EEG는 비침습적인 방법을 통해 생체신호를 추출하며 여기서 수집된 데이터들은 심리학, 언어학, 의학과 같이 사람의 생각이나 감정상태, 뇌 질환의 진단이 필요한 다양한 분야에서 활용되고 있습니다. 본 아티클 시리즈에서는 LUCY 서비스의 핵심인 뇌파에 대해 알아보겠습니다.
앞선 3편에서는 정신질환 종류별 EEG 바이오마커 연구의 결과를 살펴보았습니다. 이러한 EEG 연구에서는 EEG 데이터를 어떻게 분석하는 것일까요? 분석 과정은 크게 전처리와 전처리 이후 분석으로 나뉩니다. 전처리 이후 분석을 위해서는 전처리를 잘하는 것이 중요한데요, 이번 아티클에서는 EEG 데이터 전처리에 대해 자세히 같이 보겠습니다.
전처리란 수집 직후의 데이터를 분석하기 좋은 형태로 만드는 작업입니다. 수집한 직후의 데이터는 바로 분석에 쓸 수 없기 때문에 전처리 과정이 꼭 필요한 것인데요, 이 전처리 전 데이터를 보통 ‘날 것의 데이터’, ‘가공되지 않은 데이터'이라는 의미로 raw 데이터라고 부릅니다. 그렇다면 왜 raw 데이터로는 분석을 할 수 없는지 예시를 통해 살펴보겠습니다.
EEG raw 데이터를 하나 가져와봤습니다. 얼핏 봐도 지저분해보이지 않나요? 전처리 전 EEG 데이터에는 눈 깜박임, 근육의 움직임, 심장 박동, 전극의 움직임 등으로 인한 잡음(Noise 또는 Artifact)이 포함되어 있습니다. 이러한 잡음들은 1 ~ 50 uV 수준의 미약한 뇌파 신호보다 큰 폭으로 빠르게(약 5000 ~ 30000 uV) 진동하는 모습을 보이죠. 위 그림에서 크고 빠르게 요동치는 부분이 잡음이 섞인 부분이라고 볼 수 있습니다.
그런데 뇌 신호 외에 이렇게 다른 잡음이 섞인 데이터를 갖고 그냥 분석을 한다면 결과 또한 왜곡될 것입니다. 그리고 꼭 잡음이 아니더라도 전극이 제대로 두피에 붙지 않아 데이터가 잘 입력되지 않는 경우도 종종 발생합니다. 이 경우에는 입력된 데이터를 신뢰할 수 없죠. 따라서 데이터를 정제하고, 하고자 하는 분석에 맞는 형태로 만드는 전처리 과정이 필수적으로 필요합니다.
데이터 분석의 8할이 전처리라고 할 만큼 전처리는 매우 중요한 단계입니다. 질 좋은 뇌파 데이터를 얻기 위해서는 잡음을 제대로 제거해야 하죠. 그런데 전처리를 어떻게 하느냐는 연구 목적, 실험 설계, EEG 장비, 분석 계획에 따라 달라집니다. 따라서 연구자가 자신의 연구에 맞게 전처리 방법을 선택해야 하는데요, 이번 아티클에서는 많은 연구에서 하고 넘어가는 전처리 위주로 소개하도록 하겠습니다.
필터링(Filtering)은 특정 주파수 대역을 제외하거나 포함시키는 작업입니다. 너무 고주파수 대역, 너무 저주파수 대역에는 잡음이 섞여 있을 수 있기 때문이며, 관심 주파수 영역대가 아닌 부분은 필요가 없으니 필터링을 통해 제거하는 것입니다. ‘포함'하는 기준점을 설정하는 필터링에는 pass, ‘제거'하는 기준점을 설정하는 필터링에는 ‘stop’이라는 이름이 붙습니다. 필터링에는 네 가지 종류가 있습니다.
1) High-pass filtering은 특정 주파수 값보다 ‘큰' 주파수를 가지는 신호만 포함시킵니다. 가령, high-pass filtering을 0.1 Hz로 두었다면, 0.1 Hz보다 큰 주파수를 가지는 신호만 포함시키는 것이지요. ‘설정한 값보다 high한 값들을 pass 시킨다.’라고 이해하시면 쉽습니다.
2) Low-pass filtering은 반대로 특정 주파수 값보다 ‘작은' 주파수를 가지는 신호를 포함시킵니다. Low-pass filtering을 100 Hz로 두었다면 100 Hz보다 작은 주파수 영역대만 포함시키는 것이지요. High, low의 단어 뜻 때문에 왠지 high-pass filtering에 더 높은 값을 설정해야 할 것 같은 느낌이 들지만 ‘설정한 값보다 high (또는 low)한 주파수를 가진 신호만 pass하는 filtering이라고 단어 그대로 이해하면 헷갈리지 않으실 겁니다.
3) Band-pass filtering은 설정한 범위 내의 주파수를 가지는 신호만 포함(Pass)시키며, 4) Band-stop filtering은 설정한 범위 내의 주파수를 갖는 신호를 제거(Stop)시키는 필터링입니다. 특히, 1 Hz 단위의 특정 주파수를 차단하는 필터는 노치 필터(Notch filter)라고 합니다. 노치 필터는 사용하는 전원의 60 Hz 교류 전류로 인해 60 Hz 단위(60 Hz, 120 Hz, 180 Hz …)에서 발생하는 잡음(Figure 2)을 차단하기 위해 사용됩니다.
관심 주파수 영역대로 band-pass filtering을 걸어준 뒤, 해당 범위 내에 포함되는 60 Hz 단위의 잡음을 노치 필터를 통해 제거하는 것이 일반적입니다. 적절한 band-pass filtering은 EEG에 포함되어있는 다양한 잡음들을 효과적으로 제거할 수 있기 때문에 이후 분석에서 필요한 주파수 영역대로 필터링을 해주는 것이 필수적입니다.
Re-referencing은 reference를 재설정해주는 전처리입니다. 여기서 ‘reference’는, EEG로 뇌파를 촬영할 때 뇌의 활동과는 관련 없는 기준 전극을 설정하여 우리가 원하는 뇌의 신호만 효과적으로 포착하는데, 이때의 기준 전극(또는 참조 전극; Reference electrode)을 의미합니다. 본 시리즈 아티클 2편에서 보통 귓볼과 귀의 유양돌기에 위치한 전극을 기준 전극으로 활용한다고 언급한 바 있습니다. 그런데 사실 EEG 촬영 당시에 reference를 어디로 두는지는 크게 중요하지 않습니다. 촬영이 모두 끝난 후 전처리를 할 때 이 re-reference라는 reference 재설정 과정을 거치면 되거든요.
흔히 re-reference를 할 때 reference로 사용되는 것은 1) 기록된 기준 전극이 있다면 그 기준 전극(보통 유양돌기나 귓볼에 위치한 전극), 2) 특정 전극에서 기록된 신호(보통 정중앙에 위치한 Cz 전극), 3) 모든 전극에서 기록된 신호의 평균입니다.어떤 것을 reference로 삼을지 결정하는 것은 연구자의 몫인데요, 만약 하나의 전극을 reference로 삼는다면 그 전극의 신호가 지저분하거나 잘 접촉이 안 되었을 경우 reference로서 제대로 된 기능을 하지 못하니 주의해야 합니다. 또한 왼쪽 또는 오른쪽 한 쪽의 전극만 reference로 삼는 것도 해당 반구에 편향이 생길 수 있기 때문에 주의해야 합니다. 모든 전극에서 기록된 신호의 평균을 reference 삼을 때는 반드시 머리 전체를 커버할 수 있을 정도로 충분한 전극이 있어야 합니다. 그리고 뇌파와 관련이 없는 귓볼, 코 등에 있는 전극은 제외하고 평균을 내야 합니다. 결국, reference로서 사용될 전극은 적절한 위치에서, 제대로 신호가 입력되었어야 하며, 원하는 뇌파 신호의 위치에서 되도록이면 먼 곳에 있는 것이 좋습니다.
우리는 bad channel이라고 하는 것을 제거해야 합니다. 그렇다면 bad channel이 무엇을 지칭하는 걸까요? 먼저, ‘channel’은 EEG 캡의 전극 하나하나를 분석 단계에서 일컫는 말입니다. ‘Bad’는 말 그대로 나쁘다는 것인데요, 적절한 신호가 기록되지 않았다는 뜻입니다. 따라서 bad channel은 두피에 전극이 잘 부착되지 않았거나 좋은 신호가 기록되지 않은 채널을 의미합니다. 이런 채널은 이후 분석에 사용할 수 없기 때문에 제거해야 합니다.
그런데 bad channel이라고 판단되는 것을 모조리 제거할 경우 두 가지 문제가 있을 수 있습니다. 첫 번째는 EEG를 찍은 사람마다 채널 수가 달라 그룹 단위의 데이터를 만들기 힘들다는 것, 두 번째는 분석에 사용할 채널이 충분하지 않을 수 있다는 것입니다. 따라서 bad channel을 그냥 제거하기보단 제거한 뒤 해당 채널에서 발생했을 것 같은 신호를 추측해 복원하는 방법을 많이 쓰는데요, 이를 보간법(Interpolation)이라 합니다. 다시 말해, 신호가 적절하게 들어온 good channel들의 데이터로 bad channel 데이터를 복원하는 것이지요. 보간에는 다양한 수학적 방법이 사용되는데, 가장 흔한 방법으로는 전극이 촘촘히 매핑되어 있을 때 두피의 전위를 정확하게 계산해내는 spherical splines 방법이 있고, 계산량이 많지 않아 시간이 많이 들지 않는 radial basis function 방법도 있습니다.
ICA는 Independent component analysis의 줄임말로, 뇌파 신호와 잡음이 섞여 있는 EEG 데이터에서 독립적인 성분들을 분리하는 기술입니다. 뇌파 신호와 상관이 적은, 눈에 띄게 독립적인 성분인 잡음을 찾아 제거해주는 데에 특화된 기술이지요. 필터링은 주파수 대역을 기준으로 잡음을 제거하는 역할을 했다면, ICA는 EEG 신호 내 눈 움직임이나 심장 박동, 근육 움직임과 관련된 잡음을 찾아 제거할 때 많이 사용합니다. ICA 결과로 제시되는 성분(component)들 중 잡음 신호의 성분들은 뇌 신호와 확실히 구분되는 뇌전도 지도(topography)의 특징이 나타납니다.
위 그림을 같이 한번 보겠습니다. 첫 번째 눈 깜빡임(Eye blink)의 경우, 상단에 빨간색이 몰려있는 양상이 나타납니다. 눈쪽에서만 신호가 나타난다는 뜻이지요. 좌우로 눈을 움직여서 나타나는 Horizontal eye movements는 빨간색과 파란색이 여덟 팔(八) 모양으로 좌우로 나뉘어 분포하고 있습입니다. 심장박동(Heartbeat) 성분은 우하향 대각선이 보이며 오른쪽 상단에서 왼쪽 하단으로 갈 때 파란색에서 빨간색으로 색이 점차적으로 변하는 모습입니다. 근육의 움직임(Muscle activity) 또한 대표적인 ICA로 분리되는 성분 중 하나인데요, 빨간색 또는 파란색이 뇌전도 지도의 한쪽에 국소적으로 몰려 있는 양상으로 나타납니다. 마지막으로, EEG로 뇌파를 촬영할 때 전극은 100에서 5000 Ω 사이의 적절한 임피던스(impedance)를 유지해야 하는데, 임피던스가 갑작스럽게 변하면 이 또한 원치 않은 잡음을 발생시키기 때문에 제거해야 합니다. 이렇게 ICA를 통해 잡음들을 분리해내고 이를 제거하여 뇌 신호만을 남기는 작업을 하는 것이지요.
뇌파 데이터는 많은 경우 주파수 대역으로 구분되어 분석됩니다. 각 주파수 대역이 의미하는 뇌의 활동이 다르기 때문인데요, 주파수 대역별로 데이터를 분석하고자 한다면 이 주파수 변환을 전처리 과정 중에 해주어야 합니다. 시간의 흐름에 따라 기록된 EEG 데이터를 주파수 대역별로의 세기로 계산하는 작업이죠. 우리는 전자를 시간 도메인(time domain) EEG 데이터, 후자를 주파수 도메인(frequency domain) EEG 데이터라고 합니다.
주파수 변환을 할 때 흔히 사용되는 계산 방법에는 푸리에 변환(Fourier transform), 웨이블릿 변환(Wavelet transform) 등이 있습니다. 이 방법들의 원리를 아주 간단하게 설명하면 시간 도메인의 데이터를 주파수 영역에서 해석하는 것이라 할 수 있습니다. 즉, 시간 축의 데이터가 특정 주파수에서 얼마만큼의 크기를 갖는 신호들로 이루어져 있었던 건지 해석하여 나타내는 것입니다. 이렇게 주파수 변환을 한 후에는 파워 스펙트럼 밀도(Power spectral density; 이하 PSD)로 나타내는 경우가 많습니다. 아래 그림처럼 각 주파수에서 얼마만큼의 세기(파워)를 갖는지 나타내는 것이지요.
아티클 1편에서 봤듯이 보통은 델타파(0.5 ~ 4 Hz), 세타파(4 ~ 7 Hz), 알파파(8 ~ 13 Hz), 베타파(14 ~ 30 Hz), 감마파(31 ~ 50 Hz), 이렇게 다섯 개의 영역으로 구분하여 각 파의 크기를 계산합니다. 다만, 각 주파수 대역을 어디서부터 어디까지 설정할 것인지는 연구자의 결정에 달려있습니다. EEG 논문들을 잘 살펴보시면 같은 델타파여도, 같은 세타파여도 주파수 대역 값이 다르다는 것을 확인하실 수 있으실 겁니다. 더불어, 각 파의 절대적인 크기를 나타내는 절대 파워스펙트럼 밀도로 분석을 할 수도 있고, 전체 주파수 대역 대비 해당 주파수 대역이 차지하는 비율(%)이 어느 정도 되는지를 나타내는 상대 파워스펙트럼 밀도로 분석을 할 수도 있습니다. 이 결정 또한 연구자의 몫입니다.
위에서 각 전처리의 방법과 해당 전처리를 왜 해야 하는지를 살펴보았습니다. 이렇게 이론적인 내용만 쭉 나열하면 지루하니 실제 연구에서 어떤 식으로 전처리를 했는지, 우리가 이해할 수 있는지 같이 살펴보실까요?
Figure 6.에서는 관심 있는 부위에 전극 4개를 부착하여여 뇌파 신호를 측정하였고, 참조전극(reference electrode)으로 양쪽 귓볼에 있는 두 전극을 사용했습니다. 또한, 대역통과필터(Band-pass filtering)를 통해 0.1 Hz에서 100 Hz의 신호만 통과시킨 후 눈 움직임으로 생긴 잡음(EOG: ElectroOculoGraphy)과 너무 세기(파워)가 큰 신호를 제거하였습니다. 파워 값이 큰 신호는 뇌파 신호가 아닐 가능성이 크기 때문이죠. 이후 다시 한번 대역통과필터로 주파수 대역대를 한정하고(FIR 필터는 Finite Impulse Response의 줄임말로 필터의 종류 중 하나라고 생각하시면 됩니다), 연속적인 뇌파 신호를 1초 단위의 불연속적 신호로 분리(epoching)했습니다. 그리고 네 가지 주파수대역의 상대 파워스펙트럼 밀도를 계산했습니다.
Figure 7.에서는 low-pass filter는 40 Hz, high-pass filter는 0.5 Hz로 설정하여 0.5 Hz ~ 40 Hz의 신호를 통과시켰습니다. 또한, ICA를 통해 눈 깜박임 신호를 제거하고, 파워 스펙트럼 분석으로 5개 주파수 대역을 구분한 뒤 그중 잡음이 많았던 델타파를 제거했습니다. 두 논문에서 모두 각 파의 주파수 대역을 명시하고 있으며, 알파파와 감마파의 대역 값이 서로 다르다는 것도 주목해볼 만한 포인트입니다.
어떤가요? 논문에 적힌 EEG 전처리 방법이 이해가 되니 신기하고 재밌지 않나요? 아직 완벽하게 이해하지 못하셨더라도 전처리 흐름과 왜 그 전처리를 하는지 정도 해석이 되셨다면 성공입니다.
이상으로 전처리란 무엇인가, EEG 데이터를 전처리 할 때는 어떤 과정을 왜 거쳐야 하는가에 대해 살펴보았습니다. 전처리를 어떻게 했느냐가 연구 결과를 좌지우지한다고 해도 과언이 아닐 만큼 전처리는 매우 중요한 과정입니다. 비단 EEG 데이터뿐만 아니라 어떤 데이터든지간에 그렇지요. 다음 아티클에서는 뇌파와 VR, 뇌파와 모바일 어플리케이션이 결합되었을 때 어떤 시너지 효과를 발휘하는지와 함께 뇌파 산업의 전망에 대해 이야기해보겠습니다.
[1] Albert, B., Zhang, J., Noyvirt, A., Setchi, R., Sjaaheim, H., Velikova, S., & Strisland, F. (2016). Automatic EEG processing for the early diagnosis of traumatic brain injury. Procedia Computer Science, 96, 703-712.
[2] Walters-Williams, J., & Li, Y. (2012). BMICA-independent component analysis based on B-spline mutual information estimation for EEG signals. Can. J. Biomed. Eng. Technol, 2, 63-80.
[3] Robbins, K. A., Touryan, J., Mullen, T., Kothe, C., & Bigdely-Shamlo, N. (2020). How sensitive are EEG results to preprocessing methods: a benchmarking study. IEEE transactions on neural systems and rehabilitation engineering, 28(5), 1081-1090.
[4] Kim, S. P. (2018). Preprocessing of eeg. In Computational EEG Analysis (pp. 15-33). Springer, Singapore.
[5] Peng, W. (2019). EEG Preprocessing and Denoising. In: Hu, L., Zhang, Z. (eds) EEG Signal Processing and Feature Extraction. Springer, Singapore.
[6] Heo, J., & Chung, K. (2019). EEG recording method for quantitative analysis. Korean Journal of Clinical Laboratory Science, 51(4), 397-405.
[7] Radüntz, T., Scouten, J., Hochmuth, O., & Meffert, B. (2017). Automated EEG artifact elimination by applying machine learning algorithms to ICA-based features. Journal of neural engineering, 14(4), 046004.
[8] Secco, A., Tonin, A., Rana, A., Jaramillo-Gonzalez, A., Khalili-Ardali, M., Birbaumer, N., & Chaudhary, U. (2021). EEG power spectral density in locked-in and completely locked-in state patients: a longitudinal study. Cognitive neurodynamics, 15, 473-480.
[9] 김우종, 권미화, 권명화, & 김진구. (2015). 아로마 요법이 학업 스트레스와 뇌파에 미치는 영향. 감성과학, 18(1), 95-102.