brunch

You can make anything
by writing

C.S.Lewis

by 추보 구자룡 Oct 28. 2020

나의 데이터 리터러시 역량은 어느 정도일까?

1부. 데이터를 읽고 쓰는 습관 : 데이터 리터러시

데이터 리터러시 역량 자가진단


데이터가 풍부한 빅 데이터 시대다. 나는 제대로 데이터를 읽고 분석하고 해석하고 활용하고 있을까? 데이터를 통해 보다 나은 가치를 만들기 위해 어떤 역량이 필요할까? 나의 데이터 리터러시 역량을 스스로 진단할 수 있는 체크리스트를 만들었다. 총 15문항에 응답하여 간단하게 나의 데이터 리터러시 역량을 진단할 수 있다. 

아래 질문지에 체크해 보자.              

           


<데이터 리터러시 역량 자가진단을 위한 질문지>

다음은 데이터에 대한 질문입니다. 평소 생각하고 계시는 내용을 직관적으로 답변하시면 됩니다. 정답이 없습니다. 보기 중 하나만 체크해 주세요.


1. 데이터와 통계는 팩트가 아니라 경향(트렌드)이다.

☐ 아니다   ☐ 그렇다


2. 데이터는 알려진 사실이나 현재 상황을 나타내는 것이기 때문에 이 데이터를 바탕으로 알지 못하는 일을 미루어 짐작하면 안 된다.

☐ 아니다   ☐ 그렇다


3. 데이터는 정교하게 구조화된 측정도구를 이용하기 때문에 의도적으로 조작할 수 없다. 

☐ 아니다   ☐ 그렇다


4. 데이터 기반 문제 해결을 위해 가장 먼저 해야 할 일은 데이터 수집이다. 

☐ 아니다   ☐ 그렇다


5. 어떤 변수 간에 상관관계가 강하면 그 사이에 인과관계도 있다.

☐ 아니다   ☐ 그렇다


6. 어떤 조사에서 A집단의 평균은 35.6, B집단의 평균은 37.3으로 나타났다. 두 집단 간에 통계적으로 유의미한 차이가 있는지 검정하는 방법으로 T-test나 분산분석(ANOVA)을 사용하면 된다. 

☐ 아니다   ☐ 그렇다


7. 정밀한 데이터보다는 정확한 데이터가 더 좋은 데이터다.

☐ 아니다   ☐ 그렇다


8. 측정을 위한 척도에는 범주형 자료를 나타내는 명목 척도와 서열 척도, 연속형 자료를 나타내는 등간 척도와 비율 척도가 있다. 이 중에서 명목 척도와 서열 척도를 사용하면 산술평균을 구할 수 있다. 

☐ 아니다   ☐ 그렇다


9. 현업 실무자가 직접 데이터 분석을 하면 잘못된 분석을 할 수 있기 때문에 데이터 분석은 전문가(데이터 분석가, 데이터 과학자)에게 맡겨야 한다. 

☐ 아니다   ☐ 그렇다


10. 데이터에는 정형 데이터(연산가능, 데이터베이스나 스프레드시트 등)와 비정형 데이터(연산 불가능, 텍스트, 이미지 등)가 있다. 이 중에서 데이터의 양이 가장 많은 것은 비정형 데이터다. 

☐ 아니다   ☐ 그렇다


11. 데이터 분석은 통계분석 기술보다 문제 정의가 더 중요하다.

☐ 아니다   ☐ 그렇다


12. 텍스트 마이닝으로 키워드 간의 인과관계(원인과 결과)를 파악할 수 있다.

☐ 아니다   ☐ 그렇다


13. 데이터 분석의 결과는 의사결정을 위한 기초 자료일 뿐이다.

☐ 아니다   ☐ 그렇다


14. 시각화로 복잡한 데이터와 도표의 이면의 현실을 볼 수 있다. 

☐ 아니다   ☐ 그렇다


15. 시각화는 데이터 분석의 결과를 시각적으로 도식화한 것이기 때문에 진실을 왜곡할 수 없다. 

☐ 아니다   ☐ 그렇다



온라인으로 접속(https://forms.gle/qvUSQXGncM2hxH966)하여 직접 질문에 응답해도 된다. 온라인에서 응답을 하면 바로 점수를 확인할 수 있다. 

△ 데이터 리터러시 역량 진단 QR코드


나의 데이터 리터러시 역량 평가

데이터 리터러시 역량에 대한 자가진단을 하면 문항별로 정답을 맞히면 2점을 배점하여 총 30점 만점 기준으로 점수를 계산할 수 있다. 데이터 리터러시 역량이 어느 정도 수준인지 판단하기 위해 역량 수준을 4단계로 구분한다. 심각한 데이터 문맹(0점~6점), 어느 정도 데이터 문맹(8점~14점), 어느 정도 리터러시 역량 보유(16점~22점), 상당한 리터러시 역량 보유(24점~30점) 등으로 나눌 수 있다.


<데이터 리터러시 역량 평가 수준>



각 문항에 대한 정답과 오답 해설은 다음과 같다. 


1. 데이터와 통계는 팩트가 아니라 경향(트렌드)이다. ⇨ 그렇다

[오답 해설]

데이터와 통계는 팩트가 아니라 경향이다. 데이터 속에는 참도 있지만 거짓도 있다. 통계적 추론을 통해 사실이 아니라 경향을 파악할 수 있다.


2. 데이터는 알려진 사실이나 현재 상황을 나타내는 것이기 때문에 이 데이터를 바탕으로 알지 못하는 일을 미루어 짐작하면 안 된다. ⇨ 아니다

[오답 해설]

데이터 그 자체는 진실과 잡음이 썩여있다. 데이터에 포함되어 있는 잡음, 즉 알지 못하는 일을 미루어 짐작하기 위해 데이터 분석(추론 통계)을 한다. 데이터 이면의 현실을 봐야 데이터의 진정한 가치를 파악할 수 있다.


3. 데이터는 정교하게 구조화된 측정도구를 이용하기 때문에 의도적으로 조작할 수 없다. ⇨ 아니다

[오답 해설]

정교하게 구조화된 측정도구를 이용해도 보여주는 방법에 따라 쉽게 조작할 수 있다.


4. 데이터 기반 문제 해결을 위해 가장 먼저 해야 할 일은 데이터 수집이다. ⇨ 아니다

[오답 해설]

데이터 수집보다 문제를 구체적으로 정의하는 것이 먼저다.


5. 어떤 변수 간에 상관관계가 강하면 그 사이에 인과관계도 있다. ⇨ 아니다

[오답 해설]

어떤 변수 간에 상관관계가 강하다고 해서 그 사이에 인과관계가 있는 것은 아니다.


6. 어떤 조사에서 A집단의 평균은 35.6, B집단의 평균은 37.3으로 나타났다. 두 집단 간에 통계적으로 유의미한 차이가 있는지 검정하는 방법으로 T-test나 분산분석(ANOVA)을 사용하면 된다. ⇨ 그렇다

[오답 해설]

두 집단 간의 평균 차이를 검정하기 위해서는 T-test나 분산분석(ANOVA)을 사용해야 한다.


7. 정밀한 데이터보다는 정확한 데이터가 더 좋은 데이터다. ⇨ 그렇다

[오답 해설]

정밀한 데이터보다는 정확한 데이터가 더 좋은 데이터다. 정밀도(precision)란 무언가 똑같은 것을 반복해서 측정했을 때 얼마나 비슷한 값이 나오느냐 하는 정도다. 정확도(accuracy)란 측정된 값이 얼마나 실제 값(True value)에 가까우냐 하는 것을 말한다. 정밀하다는 것 자체가 정확하다는 것을 의미하지는 않는다. 하지만 일정하게 정확하다는 것은 정밀하다는 것을 의미한다.


8. 측정을 위한 척도에는 범주형 자료를 나타내는 명목 척도와 서열 척도, 연속형 자료를 나타내는 등간 척도와 비율 척도가 있다. 이 중에서 명목 척도와 서열 척도를 사용하면 산술평균을 구할 수 있다. ⇨ 아니다

[오답 해설]

산술평균을 계산할 수 있는 척도는 연속형 자료를 나타내는 등간 척도와 비율 척도다.


9. 현업 실무자가 직접 데이터 분석을 하면 잘못된 분석을 할 수 있기 때문에 데이터 분석은 전문가(데이터 분석가, 데이터 과학자)에게 맡겨야 한다. ⇨ 아니다

[오답 해설]

데이터 분석은 한때 전문 분석가가 하는 일이었지만, 데이터가 풍부한 시대가 되면서 당면한 문제를 빠르게 해결하기 위해 현업 실무자가 직접 데이터 분석을 통해 현명한 의사결정을 하고 있다.


10. 데이터에는 정형 데이터(연산가능, 데이터베이스나 스프레드시트 등)와 비정형 데이터(연산 불가능, 텍스트, 이미지 등)가 있다. 이 중에서 데이터의 양이 가장 많은 것은 비정형 데이터다. ⇨ 그렇다

[오답 해설]

현재 발생하는 데이터의 80% 정도가 비정형 데이터다.


11. 데이터 분석은 통계분석 기술보다 문제 정의가 더 중요하다. ⇨ 그렇다

[오답 해설]

데이터 분석은 통계분석 기술보다 해결해야 할 문제를 정의하는 일이 더 중요하다.


12. 텍스트 마이닝으로 키워드 간의 인과관계(원인과 결과)를 파악할 수 있다. ⇨ 아니다

[오답 해설]

텍스트 마이닝으로 키워드 연관어 분석을 통해 키워드 간의 상호 연관성을 확인할 수 있다.


13. 데이터 분석의 결과는 의사결정을 위한 기초 자료일 뿐이다. ⇨ 그렇다

[오답 해설]

데이터 분석의 결과는 기초자료이며, 이 자료를 바탕으로 현명한 의사결정을 할 수 있다. 분석 결과물 자체가 의사결정이 되면 안 되며, 의사결정을 위한 참고 자료로 활용할 수 있다.


14. 시각화로 복잡한 데이터와 도표의 이면의 현실을 볼 수 있다. ⇨ 그렇다

[오답 해설]

시각화는 아이디어를 탐구하고 정보를 전달할 수 있는 빠르고 효과적인 방법이다. 복잡한 데이터와 도표의 이면의 현실을 볼 수 있게 만들어야 한다.


15. 시각화는 데이터 분석의 결과를 시각적으로 도식화한 것이기 때문에 진실을 왜곡할 수 없다. ⇨ 아니다

[오답 해설]

시각화를 통해 진실을 왜곡할 수 있다. 그래프의 세로축 설정을 어떻게 하는가에 따라 간단하게 왜곡할 수 있다. 그러나 왜곡하면 안 된다.


풍부한 데이터 시대를 살아가는 현명한 방법은 나의 데이터 리터러시 역량 수준을 높이는 것이다. 

이전 06화 비즈니스 문제 해결을 위한 첫걸음, 데이터 리터러시
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari