brunch

AI 시대의 데이터 리터러시

왜 모두가 데이터를 알아야하는가

by 데이터쟁이

AI 시대의 데이터 리터러시:

왜 모두가 데이터를 알아야 하는가?



우리는 바야흐로 AI 시대에 살고 있으며, 우리의 일상은 인공지능 기술로 인해 근본적으로 변화하고 있다. 이 모든 혁신의 원동력은 바로 데이터(Data)이고. 과거에는 데이터 분석 능력이 특정 분야 전문가들만의 영역이었지만, 이제는 데이터를 읽고, 해석하며, 활용하는 능력, 즉 데이터 리터러시(Data Literacy)가 비전공자를 포함한 모든 현대인의 필수 교양이 되고 있다.


1. 데이터, AI 시대의 '새로운 원유'

데이터는 AI를 작동시키는 핵심 연료이며, AI는 방대한 데이터를 학습하여 패턴을 인식하고 미래를 예측한다. 이처럼 데이터 분석이 AI에게 위임되는 시대에, 우리가 데이터를 알아야 하는 가장 중요한 이유는 AI가 내리는 결정에 대한 '이해'와 '판단'의 주체가 되어야 하기 때문이다.

AI가 추천하는 콘텐츠, 의사 결정의 근거로 제시되는 통계, 심지어 정부 정책의 기반까지, 모든 것이 데이터 분석의 결과이다. 우리가 데이터의 작동 원리를 모른다면, AI가 제시하는 결과를 맹목적으로 수용하거나, 왜곡된 정보에 쉽게 현혹될 수밖에 없다.


2. 비즈니스를 넘어 일상 속 데이터 분석

데이터 분석의 중요성은 더 이상 기업의 전략이나 복잡한 기술에만 머물지 않는다. 일상생활에서 데이터 리터러시를 발휘하면, 우리의 선택의 질을 비약적으로 높일 수 있다.


가짜 뉴스를 구별하는 능력: 온라인에 범람하는 정보 속에서 제시된 통계의 출처, 표본의 크기, 조사 방식 등을 비판적으로 검토하여 정보의 신뢰도를 판단할 수 있다.

가짜 뉴스까지는 아니지만, 최근 논문을 보면서 깨달은 부분이 있다. 제로 음료를 마시면 관련 암 발병률이 30% 상승한다는 논문이였는데, "와 큰일이군 그만 마셔야겠어.." 라는 생각이 들었지만, 뭔가 반토막짜리 논문 같다는 생각이 들었다. 마침 논문을 쓰던 와이프가 "기망 같은데? 전체를 말해야지 일부만 가지고 전체를 대변하면 안되지.." 라고 해서 더 찾아보니, 일반 탄산 음료 (non 제로)를 마시면 200% 이상 발병률이 올라간다는 점이였다. 사실을 말하지 않음으로 속이는 기망이였다.

" 제로 콜라 마시면 암 발병율이 30%나 늘어?" 라는 간단한 질문으로도 위 기망을 회피 할 수 있다.


합리적인 소비 및 자산 관리: 개인의 지출 데이터를 분석하여 비효율적인 소비 패턴을 정확하게 파악하고, 객관적인 수치에 근거한 실질적인 재무 목표를 설정할 수 있다.

의외로 초기의 뱅크샐러드가 해줬던 자산관리(라고 쓰고 조회라고 읽음) 기능과 비슷한데, 내 벌이가 이렇고, 씀씀이가 이렇다 저렇다라고 쓰면 이러이러한 방법으로 줄여보고, 이런 저런 금융상품으로 포트폴리오를 짜보라는 꽤 그럴싸한 추천을 해주기도 한다.


3. AI와 인간의 역할 분담: 데이터 리터러시의 완성

AI는 분석의 양적, 기술적 효율성을 극대화하지만, 그 분석 결과를 가치 있는 통찰로 전환시키는 것은 여전히 인간의 고유한 역할이다.


AI가 해주는 일 (효율과 계산)


방대한 데이터 처리 및 패턴 탐지

맥락 부여와 윤리적 판단

수백만 건의 데이터를 1초 내 처리하여 숨겨진 상관관계 발견 (예: 복잡한 통계 모델 구축 및 예측치 산출)

AI의 결과가 현실의 사회적, 윤리적 맥락에 부합하는지 검토하고, 편향된 데이터를 걸러내는 일


사람이 직접 해야 하는 일 (통찰과 전달)


반복적이고 정형화된 데이터 가공

Human Readable Storytelling (수치를 언어로)

정해진 기준에 따라 데이터 정렬, 분류, 표준 편차 등 계산


: 이 부분이 조금 난해한데, 수치를 글로 바꿔주는 일 정도는 AI도 잘해주긴한다. 다만 너무 그럴싸 하게 쓰기 때문에 (따라서 AI가 써준 글을 자세히 안들여다 보는 일이 생기긴 하지만) 장점이 단점으로 둔갑하게 된다. 사용자수가 2배가 늘었으니, 저희 회사는 2배 성장했어요! 같은 단순히 숫자만 보고 판단하는 식의 인사이트를 주는데, (후하게 주자면) 반은 맞고 반은 틀리다. 사용자수가 메인 KPI인 서비스(구글 광고 등이 주 매출원인 커뮤니티성 서비스)에서는 맞을 수도 있지만, 커머스나 게임 등의 Industry에서는 얼마든지 틀릴 수 있다.


사용자는 2배 늘었지만, 광고로 인한 신규 사용자만 늘고 기존 사용자들이 다 튕겨 나갔을 수도 있고

-> 사용성 하락, 매출도 하락, UX 개선 필요

사용자는 2배 늘었지만, 그리고 매출도 늘었지만, 고액 거래를 해준 한두명의 사용자가 견인했을 수도 있고

-> 기존 사용자들의 소비액은 하락.


얼마든지 해석의 다른 여지가 있기 때문에 단순하게, 몇몇 지표들만 가지고 판단하면 오산이다.



4. 결론: 데이터 리터러시는 현대인의 필수 교양

데이터 리터러시는 우리를 정보의 수동적 소비자가 아닌, 능동적인 분석자이자 비판적 검토자로 만든다. 우리는 데이터를 알 때 비로소 '왜 이렇게 되었지?'가 아닌, '이 현상의 근본 원인은 무엇이며, 다음 행동은 무엇인가?'라는 해결책으로 이어지는 질문을 던지지 않으면 안된다.

모든 직업과 일상에서 데이터 기반의 사고방식이 중요해지는 이 시대에, 데이터 리터러시는 더 나은 의사 결정미래 경쟁력을 위한 핵심 열쇠이다.


비단 데이터 분석가만의 전유물이 아니다. 숫자를 다루는 모든 사람들의 필수 교양인 셈이다.


keyword
작가의 이전글데이터 분석의 첫 삽