brunch

You can make anything
by writing

C.S.Lewis

by 김영하 Mar 16. 2016

닭이 먼저일까? 달걀이 먼저일까?

데이터의 이해와 목표 설정, 그 2개 순서의 오묘한 차이

데이터 시각화 및 분석을 시작하자! 시작이 반이다! 

그런데 무엇부터 시작하지??? 


데이터 시각화 및 분석을 할 때 대부분은 

수집 -> 저장 ->  검색 -> 분석의 과정을 거치게 될 것이다. 


아무거나 수집하면 될까? 목표가 있어야 무엇을 수집할지 결정을 할 수 있다. 

연구하는 목적에 맞도록 필요한 것들을 수집해서 탐색적 자료 분석 및 통계

검정들을 할 수 있을 것이다. 그러면

목표설정 -> 수집 -> 저장 -> 데이터의 이해 / 검색 -> 시각화/분석

의 과정이 될 것이다. 이 과정에서 데이터의 이해는 데이터의 성격 및

이 데이터를 어떻게 표현할 수 있는 방법들을 생각해보는 것일 것이다.


하지만, 데이터를 먼저 가지고 있는 경우는 어떨까? 어떤 연구를 해서 나온

결과를 미리 가지고 있을 수 있다. 또한 설문 조사 결과들도 있을 것이다. 

이미 데이터를 연구하고자 하는 이는 데이터의 성격 및 데이터를 표현하는 것을

어느 정도 파악하고 있을 것이다. 오히려 이 데이터에서 무엇을 더 찾아낼 수 있을

것인가에 더 관심이 있을 것이다. 이 경우

데이터의 이해 -> 목표설정 -> 수집 -> 저장 ->  검색 -> 시각화/분석

의 과정이 더 의미있을 수도 있다.


1. 데이터의 이해 -> 목표 설정?

2. 목표 설정 -> 데이터의 이해?


1번이냐 2번이냐? 데이터 분석 및 시각화와 관련된 자료를 보면 꼭 위 둘중에

1개를 기준으로 잡는다. 결국 중요한 것은 데이터의 시각화와 분석이다! 

각 분석하는 사람의 상황 (데이터가 기존에 있는지, 없는지, 아니면 기존 데이터에

새로운 데이터를 더 추가해야할지)에 맞게 선택하면 될 것이다. 


해묶은 닭이 먼저냐 달걀이 먼저냐 같이 꼭 고정된 생각만으로 이것이 먼저다 라는

접근적 방법보다는 데이터를 다루는 입장에서 좀더 유연한 사고방식을 가져야

하는 것은 아닐까?



작가의 이전글 데이터를 만들어보자!
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari