brunch

You can make anything
by writing

C.S.Lewis

by 데이터파머 DataFarmer Nov 03. 2023

#2 데이터 사이언티스트로 살아가기 (분석 대상)

#processmining #bigdata # datanalysis

지난 intro에 이어 본격적으로 데이터 분석 관련해서 전체적인 과정을 하나하나 적어보려 한다.


데이터 분석을 하려면 제일 먼저 갖는 고민은 아래 두 가지이다.

1) 어떤 데이터를 분석할 것이가?
2) 어떤 방법으로 할 것인가?

그러고 나서 데이터 결과를 보고 해석하며 인사이트를 갖는 것이다.


나 역시도 먼저 해결해야 할 문제는 어떤 데이터를 분석할 것인가였다,

빅데이터 분석에 활용할 수 있는 방법은 상당히 다양하고, 목적과 방법에 따라 제공되는 각종의 샘플 데이터가 많다. 가장 많이 등장하는 데이터가 보스턴 집값 데이터, 아이리스 품종 데이터 일 것이다.


하지만 이런 데이터의 한계는, 분석 방법은 알겠으나...


그래서 나에게 주는 의미는?? 


이라는 질문에 아무것도 답을 내릴 수 없다. 결국 이 질문은 나에게 의미가 있는 데이터를 분석해야  있어야 하는 것이다. 그래야 분석 방법도 재밌고, 결과도 재밌고, 이를 통해 인사이트가 나올 수 있다.


가장 간단하게 일상생활에서 내가 매일 같이 생성하는 데이터인 자동차 운행에 대한 데이터를 통해 R과 엑셀을 통해 예전에 분석을 한 브런치 글이 있었다. 이 데이터는 매일 출퇴근하며 내가 만들어낸 데이터이고, 분석하는 과정도, 그리고 결과를 통해 어떤 행동으로 이어져야 하는지도 알 수 있어서 재밌었다.


그래서 이번에 몇 개월간 글을 이어가야 하는데 나는 무엇을 분석할 것인가에 대해 고민을 했고,

내가 찾은 녀석은 바로 우리 병원에 다니는 로봇이었다.


나는 3개월 동안 이 로봇들의 데이터를 일거수일투족 삿삿히 살펴서 분석해보려고 한다.


잘 걸렸다!



매거진의 이전글 #1 intro 데이터 사이언티스트로 살아가기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari