brunch

You can make anything
by writing

C.S.Lewis

by 정경문 Jun 18. 2022

인공지능 시대에 필요한 생존능력

개인에게 필요한 4가지 데이터 활용 역량과 현업 꿀팁

# 01. 왜 우리는 데이터 활용 역량을 가져야 하는가?


1990년대 개인 컴퓨터(PC), 2000년대 인터넷, 2010년대 스마트폰, 그리고 오늘날 사물인터넷(IoT), 클라우드(인터넷상 저장공간)등이 확산하면서 다양한 디지털 개념 또한 등장하게 되었습니다.


이러한 정보통신기술의 융합으로 이루어진 4차 산업 혁명은 데이터를 기반으로 한 빅데이터와 인공지능 산업의 빠른 성장을 가져왔습니다. 특히 코로나-19 이후 사람들이 인터넷 공간에서 보내는 시간이 늘어나면서 데이터의 생산, 공유, 확산이 더욱 빨라졌습니다.


하지만 역설적으로 엄청나게 많은 양과 순식간에 지나가는 빠른 데이터 속에서 "의미 있는 데이터 찾기"는 점점 더 어려워졌습니다.

https://alliedacademies.com/big-data-2019/2019


바다에서 진주를 찾는 능력,
이것을 가공해 보석을 만드는 역량


바로 이러한 오늘날의 상황이 개인이나 기업에게 데이터 활용 역량이 필요한 이유입니다. 데이터를 얻을 수 있는 환경이 넓어지면서 데이터 리터러시의 유형이 많아졌습니다. 그럴수록 데이터를 다루고 활용할 수 있는 능력, 복잡한 디지털 환경 속에서 본질을 이해할 수 있는 능력을 갖춘 사람들이 필요하게 되었습니다.


우리는 앞서 데이터 레이크-데이터 웨어하우스-데이터 마트의 개념을 살펴보았습니다.

데이터는 우리에게 물과 같다고 말씀드렸습니다. 물이 비, 지하수 등 자연에서 생성되는 것처럼, 데이터도 사람, 컴퓨터, 기계에서 끊임없이 생산됩니다.


호수의 물이 깨끗이 걸러지고 목적에 맞게 창고에 저장되고, 마트를 거쳐 우리 손에 전달되는 것처럼, 데이터도 형태가 정해진 것과 정해지지 않은 것들을 한 곳에 모아놓습니다. 그리고 목적에 따라 데이터 웨어하우스, 데이터 마트를 거쳐 분석과 인공지능 모델 개발에 쓰이고 있습니다.


이렇듯 4차 산업혁명으로 오늘날 데이터는 물과 같이 생존에 필수가 되었습니다. 이로 인해 데이터를 해석하고 활용하는 능력은 이제 데이터 분석가, 데이터 사이언티스트와 같은 전문 영역 사람들에게만 필요한 것이 아닙니다.

바다에 물이 아무리 많아도 바닷물을 마실 수는 없습니다.
마찬가지로 데이터가 아무리 많아도, 아무 데이터나 무작정 쓸 수는 없는 노릇입니다.


그러므로 우리가 생활하고, 일하는 다양한 분야의 데이터를 수집해서 분석하고, 그것을 합리적인 의사결정에 쓸 수 있도록 기초역량을 길러야 합니다. 무엇보다 중요한 것은 데이터를 기술적으로 다루는 것 이전에, 문제의 원인과 해결방안을 논리적으로 생각하고 원하는 목적을 달성할 수 있는 힘입니다.


그런데 MZ세대를 비롯한 많은 분들이 데이터 분석능력을 취업과 자기 계발을 위한 일종의 스펙(SPEC) 쌓기로 인식하는 것 같아 안타깝습니다. 가고자 하는 방향이 없다면, 지금 딛는 그 걸음이 목적지와 다른 방향일 수 있는 것처럼, 목적이 없는 데이터 분석 역량 쌓기는 흔들리고, 길을 잃기 마련입니다.


많은 분들이 데이터 분석을 자기 계발을 위한 자격증 공부에서 시작할 것이라 생각합니다. 그리고 데이터로 문제를 해결하는 프로세스를 수험서에서 배울 것 같습니다. 하지만 학교 시험문제가 현실의 문제와는 많이 다릅니다. 마찬가지로 실제 데이터 분석 업무를 수년간 수행해보니 많은 부분에서 책의 그것과는 달랐습니다.


과거 데이터 관련 업무는 엑셀, R(알), SQL(에스큐엘)로 수행해왔습니다. 그리고 지금은 Python(파이썬)으로 같은 업무를 수행하고 있습니다. 그 과정에서 얻게 된 것은 언어가 아니었습니다. 바로 문제를 해결하는 노하우와 절차였습니다. 그리고 수많은 시행착오를 반복하면서, 제 주변 분석 과제도 같은 어려움과 고민을 한다는 것을 알게 되었습니다.


이 책(강연)은 같은 어려움을 먼저 겪고 해결한 저와 동료들, 그리고 학생들의 이야기입니다. 모두가 같은 시행착오를 반복할 필요는 없습니다. 아무쪼록 이 강연이 개인적인 목표 달성과 기업의 성과를 이끌어내는데 도움이 되었으면 좋겠습니다. (마무리를 하면서) 그런 의미에서 다소 실무적인 관점에서의 역량을 통해 직접적인 도움이 되는 데이터 활용 역량을 정리해 드리고자 합니다.



# 02. 개인에게 필요한 데이터 활용 역량을 키워요(feat. 현업 꿀팁)


데이터 활용 역량을 높이기 위해 조직 개인의 역할을 나눠 생각해볼 수 있습니다. 조직은 전체적인 관점에서 이야기했다면, 여기서는 개인에게 필요한 4가지 데이터 활용 역량을 정리해보겠습니다.


여러분들은 이 책을 읽고(강의를 듣고) 개인적으로 인생이나, 재테크, 그리고 회사 업무에 데이터 사고 → 분석 → 활용으로 이어지는 경험을 하시게 될 겁니다. 그런데 술술 읽었던 책과는 달리 막상 활용을 하려면, 막히는 부분이 있으시리라 생각됩니다. 그럴 때는 문제 해결 프로세스를 생각해보는 방법을 추천합니다.


앞서 문제 해결 프로세스는 문제정의 → 원인 분석 → 해결방안의 순으로 쉽게 설명을 드렸습니다. 데이터 분석을 통한 문제 해결 역시 유사한 방식으로 전개됩니다.

<데이터 분석 문제 해결 프로세스>

문제정의 → 데이터 수집 및 전처리 → 데이터 분석 → 모델링 및 관리


데이터 분석을 통한 문제 해결 프로세스는 책이나 이론마다 조금씩 다를 수 있습니다. 하지만 각 단계에서 필요한 역량은 다음과 같이 뽑아낼 수 있습니다.


이 책(강의)에서 주로 설명하는 데이터 사고력은 모든 문제 해결의 기반이 되는 땅(earth)과 같습니다. 비옥한 땅에서 문제도 싹이 트고, 열매도 맺고 할 수가 있습니다. 가장 중요한 사고력이 기반이 되어야지만 데이터를 이해하고 최종 목적지까지 이끌어나갈 수 있는 것입니다.


그러한 땅이 준비되었다면 첫째로 문제에 대한 명확한 인식을 통해 목적을 명확히 하는 것이 필요합니다. 세상에는 상상하지 못할 양의 데이터가 있잖아요. 그렇기 때문에 한정된 시간 안에서 우리에게 꼭 필요한 데이터를 파악하고 찾아내는 일이 그다음 할 일입니다. 이렇게 수집된 데이터는 우리가 살펴본 데이터, 통계, 컴퓨터 지식이 통해 분석의 성과물이 나옵니다. 그러면 우리는 리포팅도 하고 의사결정을 합니다.


그렇다면 각 단계에서 필요한 능력을 본격적으로 알아보겠습니다.



#03. ① 문제정의 능력

 

나에게 단 1시간이 주어진다면
문제를 정의하는데 55분을 쓰고,
해결책을 찾는 데는 오직 5분만 쓸 것이다.
 If I had only 1 hour to save the world, I would spend 55 minutes defining the problem and only 5 minutes finding the solution.

- 아인슈타인(Albert Einstein) -


아인슈타인이 남긴 이 명언은 문제를 정확하게 알아야 그에 맞는 해결책도 찾을 수 있다는 의미입니다.

그만큼 문제 정의는 중요합니다. 이 책(강의)에서 학습한 대로 문제를 현재 상태와 이상적인 상태의 차이를 확인하고 문제를 정의하는 능력은 꾸준한 연습을 통해 높여나가시기 바랍니다.


현업에서는 수십 년 일을 했지만 문제 정의에 여전히 서투른 경우가 많습니다. 가장 많은 경우가 데이터로 문제를 해결하라?라는 틀에 말에 갇혀 있는 경우입니다. 데이터가 먼저가 아니고 문제정의가 우선이다를 명심하세요. 내가 풀고자 하는 문제가 있어야지 데이터를 활용할 수 있습니다.


문제정의 상황의 예를 들어 보겠습니다. "콜센터의 고객만족도를 높여라"라는 문제가 있습니다.

그렇다면 고개만족도란 무엇인가요? 단순히 고객 만족도 조사 결과를 0점~5점으로 평가하는 방법이 있겠네요. 하지만 좀 더 구체적으로 접근해보겠습니다.


우선 고객만족도를 높이는 문제에서 "고객 만족도"가 무엇인지? 의미가 모호합니다. 그렇다면 이 모호한 고객만족도를 숫자로 정의하는 것부터가 문제 정의의 시작입니다.

고객만족도  = 고객 요청사항 처리율 + 처리속도 + 긍정 고객 피드백 비율

  * 고객 요청사항 처리율 = 처리건수 / 접수건수
  * 처리속도 = (처리일자 - 접수일자) / 목표기간
  * 긍정 고객 피드백 비율 = 긍정 언어 / 전체 언어 (비정형 언어분석)


이처럼 정성적인 문제를 정량으로 바뀌서 정의하고, 그것을 데이터로 해결하는 역량이 필요합니다.


아빠, 나는 키가 얼마나 클 수 있을까?


사춘기 아이가 요즘 키가 잘 자리지 않는다며 고민하고 있습니다.  그래서 아이와 어떻게 하면 키가 크는지를 찾아보는데 키가 유전이라는 정보를 우연히 마주하게 되었습니다.


엄마 키와 아빠 키를 입력하면 아이의 키를 계산해주는 사이트를 찾았습니다.

아빠 키를 입력하세요. 엄마 키를 입력하세요. 당신의 예상키는 000 cm입니다.


아빠 키 □

엄마 키 △

아이키 ○


여기에 쓰인 공식은 (아빠 키 + 엄마 키) + 13 /2입니다. 이것을 바로 자녀 키 예측공식이라고 합니다.

아이키 ○ = (아빠 키 □ + 엄마 키 △ ) + 13 /  2


이것을 좀 어른스럽게 바꿔볼까요? 아주 조금만요.

아빠 키 □ = X₁

엄마 키 △ = X₂

아이키 ○ =  Y


아이키 Y = (아빠 키 X₁ + 엄마 키 X₂ ) + 13 /  2


이렇게 최종적으로 구하고자 값을 데이터 분석에서는 Y값이라고 합니다. 그리고 Y 값에 영향을 주는 다양한 원인(X) 들을 찾아서 생각해 보는 것이 바로 문제 정의입니다. 어디서 많이 본 것 같죠?

Y = aX +b
목푯값(Y) = 영향을 주는 값(X)들로 나타내기


제가 예로 든 아이의 키는 아빠 키와 엄마 키만으로 결정되는 것으로 간단히 계산했지만 실제로는 그렇지 않겠죠?  실제로는  X₁(아빠 키), X₂(엄마 키), X₃(식사량), X₄(수면시간), X5(운동량).... 등 다양한 원인들이 존재하겠죠? 이처럼 정확히 원하는 값 Y을 정의하고 이 값에 영향을 주는 X들을 정의해주는 것이 바로 "문제 정의"입니다.


문제 정의 능력과  요약하면 다음과 같습니다.

1. 문제정의 능력

1) 전문분야에서 문제를 정의하고 원인 후보를 생각하고, 해결방안을 도출해내는 프로세스 사고능력
  → [현업 꿀팁] 논리적 사고(Logical Tree)를 통해 문제에 영향을 주는 요소들을 생각해본다.

2) 원하는 바가 무엇인지를 인식하고, 해당 목적을 중심으로 필요한 데이터를 정리하는 능력
 → [현업 꿀팁] Y = aX+b의 형태로 표현한다. 이때 정성적인 지표는 정량적인 지표로 바꾼다.



# 04. ② 데이터 수집 역량


두 번째는 데이터 수집 역량입니다. 

데이터 수집하기 위해 가장 먼저 할 일은 무엇일까요? 바로 일이 일어나는 순서에 따라 데이터가 생성되는 부분을 파악하거나, 데이터 생성이 필요한 부분을 인식하는 것입니다. 그다음은 일이나 비즈니스 프로세스에 따라 생성되는 데이터의 종류, 시점을 정리해 보는 것입니다.


여러분들의 이해를 돕기 위해 콜센터 업무 계속 예로 들어보겠습니다. 콜센터의 업무 프로세스는 다음과 생각해서 정리해봅니다.


-시작-

고객이 전화를 건다.  > 상담번호(ID), 접수 일시(Date), 지역(센터), 고객명, 상담자명 등

② 상담원이 고객의 문제를 듣고 안내한다. > 접수내용, 문제 유형,  카테고리(분류) 등

③ 조치를 위해 필요한 부서나 협력사에 내용을 전달한다. > 담당부서, 담당자, 전화번호 등

④ 필요한 업무 일정을 잡는다. > 조치계획 일시, 이관 부서, 방문 담당자 등

⑤ 다시 고객에게 연락한다. > 조치 계획, 일시 등

⑥ 업무를 처리한다. > 처리완료 사진, 방문 담당자, 처리 일시, 고객확인 등

-종료-


이렇게 데이터 수집을 위해서는 업무 프로세스를 이해하는 것이 중요합니다. 만약 해당 업무에 대한 지식이 없다면 여기가 바로 현장 또는 현업 전문가의 인터뷰가 필요한 순간입니다. 물론 여러분들이 현업 전문가인 경우가 가장 좋겠죠?


이 중에서 앞서 정의한 "고객 만족도"에 해당하는 데이터, 즉 문제 해결에 필요한 데이터가 무엇인지를 생각해서 정리해봅니다.

* 고객 요청사항 처리율 = 처리건수 / 접수건수
    → 접수된 고객상담 데이터 리스트(개수 계산), 처리된 고객상담 데이터 리스트(개수 계산)
  * 처리속도 = (처리일자 - 접수일자) / 목표기간
    → 처리 일시, 접수 일시, 평균 처리기간
  * 긍정 고객 피드백 비율 = 긍정 언어 / 전체 언어 (비정형 언어분석)
   → 접수내용, 문제 유형, 카테고리, 긍정어와 부정어(사전 정의)


이렇게 필요한 데이터를 파악했다면 그 데이터를 어디서 얻을 수 있는지를 생각해보고 실제로 수집해야 합니다. 회사 내부 또는 외부에 있는지 데이터의 원천(소스)을 파악하고, 데이터를 다운로드 받을 수 있는지 아니면 특정 프로그램의 쿼리*를 작성해서 받을 수 있는지 확인합니다.


*쿼리(Query)란 데이터베이스나 파일의 내용 중 원하는 내용을 검색하기 위하여 몇 개의 코드(code)나 키(Key)를 요청하는 것을 말합니다.


이때 데이터는 수집하는 주기에 따라서 데이터가 달라질 수 있음에 주의하며, 데이터 수집 주기를 정해야 합니다. 데이터 수집 주기는 실시간, 요일/일/월 단위의 특정 주기(이것을 일괄 배치 Batch라고 합니다. 모르셔도 좋습니다.)로 나눠볼 수 있습니다. 데이터의 수집 주기를 주의해야 하는 이유는 다음 그림으로 설명해보겠습니다.


아래 그림은 원 위의 빨간 점을 관찰할 때 얼마나 자주 관찰하느냐에 따라서 방향이 달라 보이기도 하고, 운동의 성격(원운동/왕복운동 등)이 달라 보이기도 합니다.


원운동 데이터의 수집 주기에 따른 인식 차이

https://www.sciencedirect.com/science/article/pii/S0042698907001459


바퀴의 알리아싱(Aliasing) 현상

(혹시 궁금하신 분들을 위해 FPS는 Frame Per Second 초당 프레임 수, rpm은 revolution per minute  분당 회전수를 의미합니다. 모르셔도 좋은 개념입니다.)


이 영상을 보시면 좀 더 이해가 되실까요? 우리 눈은 일정한 속도로 빛을 감지하고 있기 때문에 바퀴가 특정 속도 이상으로 빨라지면 우리 눈의 데이터 수집 주기가 그것을 따라가지 못하기 때문에 바퀴가 반대 방향으로 도는 것처럼 보이게 됩니다.


이것을 다른 말로는 마차 바퀴 현상(Wagon-wheel effect)이라고 합니다. 바큇살이 달린 바퀴가 실제 회전과 다르게 도는 것처럼 보이는 착시현상이죠. 이때, 바퀴는 실제 회전보다 더 느리게 회전하는 것처럼 보일 수도 있고, 반대 방향으로 회전하는 것처럼 보일 수도 있습니다.


다른 예로 주식이 오를 때만 관심을 갖는 사람들은 주식이 항상 오른다고 착각을 합니다. 데이터 수집 주기가 볼 때마다 올랐기 때문에 항상 오르는 데이터만 모으게 되는 것이죠.  데이터 수집 주기에 따라 데이터가 달라 보이는 현상, 이제 이해하셨죠?


데이터 수집 역량을 요약하면 다음과 같습니다.

2. 데이터 수집 역량

1) 문제 해결에 필요한 데이터를 생각하고, 데이터를 정리할 수 있는 능력
  → [현업 꿀팁] 전문가 인터뷰를 통해 일이 발생하는 순서에 따라 생성되는 데이터 형태/타입/정의를 알아본다.

2) 원하는 데이터의 소스를 파악하고 수집하는 능력
 → [현업 꿀팁] 다운로드, 쿼리, API, 웹 크롤링 등 본인에게 적합한 방식을 선택한다.



# 05. ③ 데이터 분석 역량


데이터 분석 단계는 탐색적 데이터 분석과 시각화 역량 둘로 나눠서 설명드릴 수 있겠습니다.


1) 탐색적 데이터 분석 능력


탐색적 데이터 분석은 수집한 데이터를 다양한 관점에서 파악하는 단계로 그래프나 통계적인 방법으로 자료를 직관적으로 이해하는 과정입니다. 이 과정은 전체적인 관점에서 독수리의 눈으로 데이터의 분포를 파악하거나 데이터 간의 상관관계, 일정한 주기나 패턴을 확인하는 작업이 포함됩니다.


데이터를 다양한 관점에서 바라보고 탐색하다 보면, 목적에 맞는 인사이트를 찾아낼 수 있습니다. 사실 이 과정은 고된 시간입니다. 들이는 시간에 비해 원하는 목적에 맞는 결과가 도출될 수도, 그렇지 않을 수도 있습니다.


이 과정에서는 데이터 다양한 방식으로 생각해보는 시도가 필요합니다. 우리는 데이터의 붙이기, 짝짓기, 집계하기를 통해 데이터를 융합하는 방법을 배웠습니다. 또 상관관계와 인과관계 같이 각 데이터 변수들 간의 관계를 파악해 볼 수도 있습니다.


탐색적 데이터 분석은 데이터 사고력 + 전문지식 + 경험에 기반이 되어서 완성되는 훌륭한 역량입니다. 여러분들은 이 책(강연)을 통해서 데이터 사고력을 갖추셨고, 각자 분야의 전문지식도 있습니다. 그렇다면 약간의 경험만으로 데이터를 바라보고 목적에 맞는 인사이트를 찾아내는 역량이 나도 모르게 생기실 것이라 확신합니다.


2) 데이터 시각화 역량


데이터 분석에서의 다음 역량은 데이터 시각화 능력(+스킬)입니다. 데이터 분석의 목적은 내 의견이나 주장을 상대방에게 전달하고 설득하기 위함입니다. 그러기 위해서 분석 결과는 다른 사람과 공유되어야 합니다. 그래서 그것의 표현에 신경을 써야 합니다. 따라서 데이터 시각화 역시 마찬가지로 데이터를 분석하는 목적 중심 접근해야 하는 것이죠.

어떻게 데이터를 표현할지 모르겠다면, 스스로에게 다음 질문을 해보세요.


무엇을 보여주고 싶은가?


비교, 분포, 구성, 관계 4가지 카테고리로 나눠봅니다.

그런 다음 변수의 수와 그중 하나가 시간인지 여부에 따라 차트 유형을 선택합니다.

다음은 데이터 시각화를 만드는 사고방식에서 제법 많이 쓰이는 선택지 차트입니다.


andrew avela chart chooser를 번역


여기서도 제가 드리고 싶은 말씀은 "스킬(Skill)"을 익히는 것이 아니라, 사고력을 키우는 것이 중요하다는 말씀을 드리고 싶습니다. 이미 잘 구성된 프로그래밍 코드와 예제는 얼마든지 있습니다. 중요한 것은 내가 원하는 목적이 무엇인지? 그리고 내 데이터에 맞는 시각화는 어떤 것인지에 따라 활용하는 역량입니다.


데이터 분석 역량을 요약하면 다음과 같습니다.

3. 데이터 분석 역량

1) 데이터를 다양한 관점에서 바라보고 탐색하면서 인사이트를 찾아내는 능력
  → [현업 꿀팁] 데이터의 붙이기, 짝짓기, 집계하기를 통해 데이터를 융합하고 서로 간의 관계(상관관계, 가능하면 인과관계)를 찾는다.

2) 발견한 정보를 다른 사람과 공유할 수 있도록 표현하는 시각화 구현 능력
 → [현업 꿀팁] 무엇을 보여주고 싶은가?를 생각해보고, 비교, 분포, 구성, 관계 중 하나를 선택한다.


세부적인 기술보다
목적에 맞는 데이터 표현이 중요

데이터 시각화에 대해 다양한 스킬이 정리된 페이지는 아래와 같이 공유합니다.

https://medium.com/ml4devs/ml4devs-newsletter-006-data-visualization-bb113ed82cac



# 06. ④ 결론 도출 및 추진력


데이터 분석과 활용의 목적은 무엇이었나요? 바로 데이터를 바탕으로 합리적인 의사결정을 하기 위함입니다.

데이터 기반 의사결정(DDDM ;Data-Driven Decision Making)이란 데이터에 기반하여 목표에 맞게 전략적으로 선택을 하고, 행동을 이끌어내는 것입니다. 이 말을 다시 두 파트로 나눠보겠습니다. 첫 번째 파트는 "목표에 맞는 전략적 선택", 그리고 두 번째 파트는 "행동을 이끌어 내는 것"입니다.


목표에 맞는 전략적 선택이란 다시 문제의 정의로 돌아갑니다.

고객 만족도의 예의 마무리를 지어보겠습니다. 앞서 고객 만족도는 다음과 같이 정의했습니다.


고객 만족도  = 고객 요청사항 처리율 + 처리속도 + 긍정 고객 피드백 비율


고객 만족도를 높이는 것은 목표이고, 처리율/처리속도/긍정 비율을 높이기 위해 전략적 선택이 필요합니다.

이를 테면, 처리율과 처리속도가 콜센터 직원수와 관련이 있다면, 직원수를 늘리는 의사결정이 요구됩니다. 또 긍정 비율을 높이기 위해 직원들에게 고객 대응 매뉴얼이나 주기적 교육연수 등을 실시해야 할 수도 있습니다.


이처럼 단순히 현상을 파악하는 것이 목표가 아니라, 행동을 기반에 둔 의사결정(선택)을 하는 것이 필요합니다. 데이터 분석의 결과를 수치와 통계 중심으로 접근하기보다는 해당 분야의 전문지식과 함께 고려해야만 목적에 맞는 결론 도출이 가능합니다.



well done is better than
well said

- Benjamin Franklin -

미국 건국의 아버지로 알려진 벤자민 플랭클린의 명언입니다.

"훌륭한 행동이 훌륭한 말보다 낫다."는 뜻인데, 저는 이 말을 "훌륭한 행동이 훌륭한 데이터 분석보다 낫다."로 옮겨보고 싶습니다.


 역사는 반복된다고 하죠. 역사를 배움으로써 현재 우리가 당면한 여러 문제를 올바르게 파악하고 대처할 수 있습니다. 지금 이 순간도 과거가 되고 있습니다. 과거 없는 현재란 있을 수 없듯이 미래도 과거와 현재의 위에 쌓입니다.


마찬가지로 데이터는 과거와 현재에 대한 흔적이고 역사입니다. 실제 데이터 분석하고 활용하는 이유는 과거와 현재의 현상을 바라기 위함이 아닙니다. 과거와 현재의 역사를 데이터로부터 뽑아내고, 이것을 통해 미래 행동에 영향을 주기 위함입니다. 그렇기 때문에 도출된 결론을 행동으로 실천하는 것이야 말로 앞선 모든 과정은 최종 목적입니다.


아이디어만 무성한 부장님으로부터 "왜 이렇게 데이터 분석이 오래 걸려?"라는 말을 들으실 수도 있습니다.

또 실력이 쌓이고 데이터 분석과 활용이 어느 정도 궤도 올라와서 과거에 했던 일과 프로젝트를 뒤돌아 보면 이런 생각이 들것입니다. "분석하고 인공지능 모델을 만들었는데 이것이 실제 잘 운영되고 있을까?"


제가 생각하는 데이터 활용의 노력은 아래 한 문장으로 정리하고 싶습니다.

문제 해결 아이디어를 내는데 1의 노력이 든다면, 그 데이터를 분석하는 데는 10의 힘이 들고, 그것을 실행하는 데는 100의 힘이 든다.


주식을 아무리 분석하고, 부동산을 아무리 분석해도 매도와 매수의 용기로 이어지지 못한다면 분석은 아무 소용이 없습니다. 단순히 버튼을 누르는 것도 힘든데, 지속적인 행동의 변화를 이끌어 내는 데는 보다 큰 힘이 듭니다. 데이터 분석의 최종 목적은 "실천과 행동"이라는 점 명심하셨으면 좋겠습니다.


결론 도출 및 추진력을 요약하면 다음과 같습니다.

4. 결론 도출 및 추진력

1) 목적 중심으로 데이터에서 원하는 결론을 도출해내는 능력
  → [현업 꿀팁] 다시 문제 정의로 돌아가 애초에 원하는 목적에 맞는 결론을 내린다.

2) 결론을 실천과 행동으로 추진하는 힘
 → [현업 꿀팁] 데이터 기반 결론과 의사결정을 행동으로 실현할 수 있는 인력, 시간, 환경 만든다.


마지막 주제는 현업과 맞닿아 있고, 책(강연)의 요약으로 작성하다보니 다소 길어졌지만,


엄청난 속도로 수없이 생산되는 데이터

이 중 원하는 데이터를 모아서, 올바른 방법으로 분석하고, 결정하고 행동한다.

이것이 전부입니다.


이제 에필로그만을 남겨두었습니다. 다음 글에서는 혼자 하는 일이 아니다. 거인의 어깨 위에 올라서라 두 가지 말씀을 끝으로 마무리하고자 합니다. 그동안 많은 관심과 피드백 주신 동료 브런치 작가님들 진심으로 감사드립니다.



매거진의 이전글 30 금요일에는 생닭을 몇 마리 납품받아야 하나?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari