brunch

You can make anything
by writing

C.S.Lewis

by 데이터파머 DataFarmer May 21. 2021

실전 시계열 분석

한빛미디어

오랜 기간 연구 기획 일을 하다 보니 간간히 데이터 분석을 해야 하는 시점이 있다.

취미 삼아 자체적으로 생산할 수 있는 데이터를 분석하기도 하지만 (해당 브런치 글), 연구 기간 중에 생산되는 데이터를 분석해야 하는 경우도 있다. 



작년 EEG 데이터와 헬스케어 관련 여러 요소 데이터에 대한 상관관계를 분석했었는데, 우연이랄까... 

이 책에서는 첫 장부터 EEG 데이터를 이야기한다. 뇌전도 데이터를 뜻하는 EEG(electoencephalography)는 1924년 처음으로 기록되었다고 한다.


지난 EEG 데이터를 분석한 것은 전기자극 저주파가 멘탈 건강에 미치는 영향을 분석하기 위한 데이터였다. 환자와 정상인 그룹에서 저주파 치료 전후 각 단계에 따라서 심장박동률의 차이는 구하는 데이터였다. 환자/정상 그룹간 차이는 있었지만 각 단계에 따른 유의한 차이는 찾지 못하였다.



본 책이 흥미 있던 부분은 바로 내가 EEG 데이터에 친숙했던 부분이 있었고, 기존에 분석했던 경험이 있었고, 데이터도 있었기 때문이다


더욱이 본 책은 필요한 소스 코드를 구글코랩에 저장되어 있다. 아주 쉽게 소스코드를 가져올 수 있었고, 지금도 계속하여 업데이트되고 있었다.


뿐만 아니라 책의 공식 저장소 깃허브에 저자가 그동안 SciPy, Pycon, PyData 등에서 발표한 다양한 시계열 데이터와 소스코드를 볼 수 있어서, 이론과 실습이 아주 수월하게 진행될 수 있었다.




책 본문에 나오는 기부금 관련 데이터와 탑승객 데이터를 주피터 R 프로그램을 이용해서 간단하게 시계열 분석을 해보았다

시계열 기부금 데이터 분석
시계열 탑승객 데이터 분석



아쉬운 것은 뒷부분 DNN RNN 분석을 하고 싶어서 다양한 패키지를 설치하려고 했는데, 주피터 환경 설정과 책에 기록된 설정이 동일하지가 않아서 대부분 설치가 안되어서 분석을 못했다.

로컬에서 다시 설치를 해보면서 하나하나 분석을 해야겠다.


추가로 책의 장점 중 하나는 스크립트를 하나하나 설명해준 대목이다. 물론 프로그래밍을 약간이라도 할 수 있는 사람이라면 쉽게 이해할 수 있을 만한 내용인데, 책에 수록된 코드를 활용하여 다른 분석을 할 때 아주 유용하게 쓰일 수 있을 것이다.



 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari