brunch

You can make anything
by writing

C.S.Lewis

by HEARTCOUNT팀 Mar 04. 2022

데이터분석이론(1) 데이터의 정의 및 종류

안녕하세요. 하트카운트 팀입니다.

이번 브런치는 지난 번 언급했던 '데이터분석이론'의 첫 주제인 '데이터(data)의 정의 및 종류'에 대해서 다루어 볼까 합니다.


첫 주제로 이것을 삼게 된 이유는 모든 데이터 분석을 하기 위해서는 그 대상이 되는 자료, 즉 데이터(data)가 필요하기 때문입니다. 데이터의 종류에 따라서 수행되는 분석의 방식이나 적합한 시각화의 종류가 다르다고 합니다. 그래서 이 내용부터 확실하게 알고 넘어가야 할 것이라고 생각했습니다.


1. 데이터의 정의

흐름에 따라 데이터를 명확하게 이해하기 위해서 위의 이미지를 만들어 보았습니다.


우리가 A에 대해서 A에 대해서 조사나 실험, 관찰을 진행하겠죠? 그 행위의 결과물이 바로 오늘 주제인 '자료(data)'입니다. A에 대한 데이터를 보고, 데이터 간 관계를 파악하는 등의 분석 및 처리과정을 거쳐서 발견하게 된 특정 패턴을 '정보'라고 할 수 있죠. 정보를 얻는 과정에서 저희가 앞으로도 쭉 다루게 될, 데이터 분석이 활용됩니다. 마지막으로 정보를 이해하고 A에 대한 유의미한 결론을 이끌어내어 만들어지는 것이 '지식'입니다. 



2. 자료(data)의 종류

- 명목척도, 순서(서열)척도, 구간(등간)척도, 비율척도


자료는 측정 방법에 따라서 구분되고 그 유형 역시 달라집니다.

표로 정리해 볼까요?

보통 기업에서 분석을 진행할 때는 매출, 인사점수 등의 알고자 하는 수치형 자료를 목표 변수인 KPI로 설정하여, KPI에 영향을 주는 다양한 변수들을 파악하고자 합니다.


*KPI, 변수란 무엇인지 궁금하시거나 추가적인 예시와 글을 보고 싶으시다면 연결된 블로그 글을 읽어 보세요.


 


실무자를 위한 데이터 자동 분석 솔루션, 하트카운트
지금 사용해보기

하트카운트 뉴스레터 구독하기는 여기를 클릭해주세요.

하트카운트 도입, 견적 및 구축 문의는 여기를 클릭해주세요.
(협업 문의는 support@idk2.co.kr로 부탁드립니다.)

하트카운트 데모 비디오는 여기를 클릭해주세요.

여기를 클릭하여 데이터 분석/시각화 커뮤니티 '데이터 히어로'에 참여하세요.


이전 05화 데이터분석이론(2) 데이터 전처리와 Tidy Data
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari