brunch

You can make anything
by writing

C.S.Lewis

by 별더하기 Feb 22. 2020

Prologue

「하버드 비즈니스 리뷰」 2012년 10월호에 실린 한 글에서는 데이터 과학자Data Scientist가 21세기 가장 섹시한 직업이라고 소개했다. 우리가 흔히 말하는 과학자는 사전적으로 ‘이론적 또는 실험적 연구를 통해 과학지식을 탐구하는 사람’이라고 정의한다. 즉, 특정 분야를 논리적 시각에 입각해 연구하는 사람을 의미한다. 이런 의미로 해석 하자면 데이터 과학자는 데이터라는 실체를 논리적으로 연구하는 사람이어야 한다.

그러면 나를 데이터 과학자라 부를 수 있을까? 나는 데이터 자체를 연구하지는 않는다. 아마도 저 명칭은 분야와 상관없이 데이터를 수집, 설계, 분석, 가공하는 등의 일련의 작업을 진행하는 사람들을 아우르는 큰 의미의 개념일 것이다.

사실 데이터는 일반적인 학문처럼 연구대상이 될 수 없다. 우리가 데이터라고 하면 떠올리는 통계학을 비롯해 최근 빅데이터 열풍을 타고 우후죽순 생겨난 데이터정보학이나 데이터과학 또는 인문학에서 다루는 문헌정보학 등은 모두 데이터를 다루는 방법과 도구를 연구하는 학문이다. 아니 정확하게는 모든 학문은 데이터 없이 연구가 불가능하다. 데이터는 이를 다루는 분야에 따라 다양하게 분석되기 때문에 모든 분야의 데이터 특성을 연구하는 것 또한 불가능하다.

이 책에서 모든 유형의 데이터 또는 그 분석을 이야기하고자 하는 것이 아니다. 다만 데이터를 통해 발현된 수없이 많은 직업군과 인연이 없는 대다수 사람이 쉽게 이해하고 공감할 수 있는 이야기를 하고 싶다. 왜냐고? 우리는 빅데이터 시대에 살고 있지 않은가.


명함을 건 낼 때마다 내 명함을 받은 사람은 어김없이 묻는다. 

“구체적으로 뭘 하는 거죠?” 

참으로 난감하다. 나는 뭘 하는 사람일까? 나도 궁금하다. 데이터를 다루기는 한다. 그런데 설명이 그리 쉽지 않다. 

“그러니까 저는 데이터를 수집하고 가공 처리해 일정한 데이터 분석기법을 적용하고 분석한 후 도출된 결과를 해석해 가치를 창출하는 일을 합니다.”

“아무튼 데이터 분석을 하신다는 거죠?” 

“네, 뭐 그런 셈이죠.”


우리는 데이터 홍수의 시대에 살고 있다. 이건 누구나 부인할 수 없는 현실이다. 빅데이터라는 신조어와 함께 파도를 타기 시작한 이 세계적인 현상은 개인의 삶까지도 그 분석 대상으로 취급할 정도다. 데이터 분석은 전문가의 영역으로 치부된다. 누구나 쉽게 범접할 수 있는 영역은 분명 아니다. 전문가 집단 또는 전문 기업에서나 다룰 법한 특수한 분석 기법을 우리 모두가 알 필요는 없다. 그러나 중요한 것은 이러한 복잡한 분석 기법을 적용하는 것보다 어떤 대상을 분석해야 할지를 판단하고 대상과 내 수준에 맞는 분석 기법을 선택하는 능력이다. 무슨 일이든지 알아야 지시도 하고, 알아야 흥미가 생긴다.

이 책에서는 수학 공식매도 통계 기법도, 알고리즘도 최대한 배제했다. 이를 기대했다면 이 책을 선택하지 않는 것이 좋다. 이 책은 데이터 분석에 대한 보편적인 이해와 누구나 데이터 분석과 가까워지기를 바라는 마음에서 썼다. 너무 어렵다는 편견과 그들만의 이야기라는 오해를 조금이라도 줄여보고 싶었다.

데이터를 분석하는 과정은 복잡해도 결과를 효과적으로 활용하는 방법은 간결하고 쉽게 전달하려 했다. 전달

하는 사람도 결과를 보고 받는 사람도 이 분석이 왜 수행되고 얻고자하는 가치가 무엇인지를 미리 알고 있다면 결과를 쉽고 간결하게 만드는 데 도움이 될 것이다.


기업, 학교 또는 그 어떤 기관이라도 조직 내에서 각자가 맡은 업무와 할 일이 모두 다르다. 또한 본인이 담당하는 영역 이외에 영역을 포괄적으로 이해하고 학습하기도 어렵다. 데이터 분석 영역이 지금 우리가 느끼고 인지하는 것처럼 전문적이고 특수한 영역이라면 일반적인 조직의 다른 영역보다 더욱 이해가 어려울 것이다. 그런 의미에서 어떤 조직이 데이터 분석 전문가를 뽑고 그로부터 유의미한 정보와 지식을 원하지만 충분히 만족할 만한 결과를 얻지 못했다면, 그 원인은 조직 구성원들이 바라보는 관점과 이해가 다 다르기 때문일 수 있다. 문제를 바라보는 관점이 통일돼야 결과의 효용 가치가 충분히 높아진다. 데이터 분석 역시 그들만의 리그가 돼서는 안 된다. 모두가 이해하고 인정하는 보편적인 영역이 돼야 더욱 발전하고 더 전문적인 영역으로 인정받을 수 있다. 

데이터는 이미 우리 생활에 많은 영향을 주고 깊이 연결돼 있다. 여기저기서 전문가를 데려가고자 많은 노력을 기울이는 것이 이를 증명한다. 또한 데이터 분석을 통해 스스로 판단하고 결정해 실행하는 시대가 왔다. 보고 아는 만큼 사랑한다는 말처럼 데이터 분석이 우리 삶 깊은 곳까지 침투하고 있다는 사실을 기억하기 바란다. 미래는 준비된자에게 언제나 결과로 말한다. 미래를 준비하는 밑거름은 분명 데이터가 될 것이다.

데이터와 거리를 두고 살아온 사람에게 데이터 분석이 ‘무엇이다’라고 설명하기는 쉽지 않다. 이 부분을 개략적이고 보편적인 관점에서설명하고자 하지만 어디를 둘러봐도 이렇게 설명하는 책은 없다. 복잡한 수식, 알고리즘, 분석을 위한 다양한 도구 등을 설명할 뿐이다.

데이터와 별로 친숙하지 않았던 사람들 또는 앞으로 데이터와 친하게 지내려 하는 사람들에게는 ‘소귀에 경 읽기’ 같은 이야기다. 이들에게는 수식도 알고리즘도 도구도 지금은 필요 없다. 다시 한 번 말하지만 알아야 관심을 갖고 알아야 친해진다.

필자의 지식은 ‘전문가’라는 호칭을 달기에 부끄럽게도 짧고 깊지 못하다. 지식의 깊이와 범위가 얼마이든 ‘내가 알고 있는 모든 것을 누군가에 쉽고 재미나게 설명하기가 이렇게 어려운 것이었구나’를 새삼 느낀다. 

데이터는 화려하거나 꾸밈이 없다. 그리고 참으로 영혼이 맑은 아이다. 데이터는 꾸미지 않은 원석 그대로의 모습을 간직하며 그 안에는거짓 없이 진실만을 담고 있다. 더욱 놀라운 점은 이러한 진실이 미래도 알려줄 수 있고 반복된 습관도 발견하게 하며 때로는 유사한 것들 끼리 묶어주기도 한다. 진실하면서 정보까지 주니 정말 착하지 않을수 없다.

이 책을 읽는 모든 사람이 데이터와 분석 기법에 친숙해지기를 기대하고 또 기대한다.


http://www.yes24.com/Product/Goods/71859635?scode=032&OzSrank=1


작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari