brunch

You can make anything
by writing

C.S.Lewis

by 여기 지금 Dec 20. 2021

데이터 리터러시

데이터 리터러시 정의란? 

문맥(context)에서 데이터를 데이터를 읽고, 쓰고 커뮤니케이션 하는 능력


데이터 리터러시 단계는 아래와 같다.

1. 기획

2. 수집

3. 이해 및 관리

4. 분석 

5. 시각화


과정을 경험해보고 나와 가장 잘 맞는 단 한가지의 역량만 업그레이드를 잘 해서 내 것으로 만들어도 좋다.




1. 기획

- 현재 문제가 무엇이고 나는 무엇을 하고 싶은 것인가?

- 문제 해결을 위한 가설 설정

- 내가 세운 가설이 적절한가?


단, 정성적인 가설은 정량적으로 치환하는 능력이 필요하다

예시: 대중교통 이용이 타 마을 대비 적은 마을. 왜 그럴까?
가설예시1: 정류장의 개수가 충분하지 않다
가설예시2: 버스비용이 비싸다
가설예시3: 버스기사가 불친절함

가설예시1,2는 값을 매길 수 있는 정량적인 예시이고,
가설예시3은 값을 매길 수 없는 정성적인 예시이다.

가설예시 3을 정량적인 값으로 변환할 수 있는 정량적인 가설예시를 세우는 능력이 필요하다.


2. 수집

어떻게 자료를 수집할까?


5wys

누가: 개인정보(생년월일, 성별, 거주지), 멤버십 등급, 성격, 학력, 주거형태, 연소득, 성향, 성격, 관심사, 자주하는 고민

언제: 연-월-일-시-분-초, 그 일자의 요일, 공휴일 여부 외, 일상적인 패턴

어디서: 매장이름, 주소, 상권, 위경도 외

무엇을: 제품 기준 정보, 카테고리

왜:...

기획과 수집 단계는 한 쌍이다. 기획과 수집 단계에서 가장 시간을 들여 많은 데이터를 생각하고, 3단계에서 추출하고 정제하는 단계를 거친다.1,2,3 단계를 압축해내는 과정을 반복하여 4,5단계로 진입한다.

*도메인이 중요한 이유*

전화 상담원을 고 성과자 저 성과자로 분리 했을때, 단 하나의 자료로 그들을 구분지을 수 있었다.
어떤 '데이터'가 그들을 구분 지을 수 있었을까?

=브라우저 종류: 기본 브라우저를 사용하냐 아니냐에 따라 성과가 달랐다.
(고객에게 버벅거림을 전달하느냐 아니냐)


3. 데이터 이해 및 관리

- 내가 수집한 데이터의 출처가 깨끗하고 사용 가능한 것인가?

- 데이터에 오류, 변수가 얼마나 포함되어있고 추가되지 않은 데이터는 없는가?

- 데이터의 양이 방대하다면 효율적인 관리를 위해 팀원 확보 필요


4. 분석

- 현재 데이터셋이 내가 하고자 하는 작업에 적합한가?

- 내가 세운 가설이 검증 될 수 있는가?


5. 시각화

- 데이터를 통해 찾아낸 의미를 어떻게 전달 할 것인가?

- 누구에게 어떤 방법으로 전달 할 것인가?

- 데이터를 모르는 사람도 한눈에 의미를 알 수 있는가?

- 제작된 결과물이 편향되지는 않았는가?

데이터를 시각화 할때 예쁜 디자인은 필요하지 않다. 룰에 따라 작성이 되어야 한다. 다만 심미성을 갖추면 금상첨화.


관련자료
1. 엑셀 파워쿼리 기초, 멜론 트로트 좋아요 지표 살펴보기
2. 엑셀 파워쿼리 기초, 네이버 금 국내 증시 실시간 연동하기 
3. 엑셀 파워쿼리 공공데이터 API 연동하기 
4. 엑셀 파워쿼리 엑셀파일, 폴더 연동하기
5. 엑셀 파워쿼리 조건열 설정하기
6. 엑셀 파워쿼리 피벗 열, 열 피벗 해제하기 / 열분할 시 따옴표 구분 방법
7. 파워쿼리를 통한 데이터 활용법
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari