brunch

데이터 이야기로 풀어내는 생각 타래

내 인생의 행동 데이터를 차곡차곡 쌓아야 할 이유

by 딱정벌레
사진=더퀘스트

요즘 들어 데이터를 생각할 일이 많다. 직접 단초를 제공한 건 '공간 빅데이터 분석 플랫폼' 글을 쓰면서였고. 그 이후 사이드 프로젝트, 최근 읽은 여러 책이 데이터 고민을 확장하고 있다. 얼마 전 랜선 트레바리에서 읽은 '절대 성공하지 못할 거야'에서 다시 확인한 시네 매치도 그랬고. 특히 요즘 읽고 있는 '문과생, 데이터 사이언티스트 되다', '아이디어 불패의 법칙'이 많은 영감을 준다. 아직 한 챕터 남았지만 읽는 내내 가슴을 두근거리게 하는 내용이 많아서 완독 하기도 전에 감상을 우선 남겨본다.

두 책은 신간인데 SNS에서도 자주 오르내리고 있다. '문과생~'은 문과 출신인 스타벅스 데이터 사이언티스트, '아이디어~'은 구글 최초 엔지니어링 디렉터가 썼다. 데이터 수집과 활용의 중요성을 강조했다는 점에서 공통점이 있었다. 그중에서도 '나만의 데이터를 일단 쌓는 것'. 문과생~은 저자가 데이터 사이언티스트가 된 계기와 데이터 사이언티스트 역할, 데이터 활용 가치 등을 다뤘다. 아이디어~는 성공하기 위해 시제품을 만들기 전 프리토타입으로 먼저 테스트해야 할 필요성을 강조했고.

문과생~에서 와 닿은 내용이 많았는데 데이터 사이언티스트 역할이 그랬다. 데이터에서 가치를 찾아내야 하는데, 그 가치를 현실에서 우리에게 도움이 될 수 있도록 활용하는 것. 돌아보면 일하면서 직장에서든, 어디든 수년간 여러 데이터가 쌓였는데 '그 데이터를 아주 의미 있게 활용했던가'라는 생각이 들었다. 첫 직장에서는 아웃링크로 트래픽을 사내에서 공유했지만 거기선 네이버 안에서 트래픽이 더 중요하다고 생각해서 어느 순간 아웃링크 트래픽을 공유하지 않았다. 신문이다 보니 트래픽에 의의를 두지 않기도 했다. 인사고과를 평가할 때도 단독 기사, 거기서 나온 타매체 파생 기사 이런 걸 보고하면 참고했고.

두 번째 직장에서는 입사하고 몇 달은 매달 첫째 날 조회수가 높고 결제가 많이 유도된 기사를 10건씩 뽑아서 공유했다. 구독자 수도 항상 그날 같이 공유하고. 회사가 인수 합병되고 난 뒤에도 한동안 공유하다가 언제부턴가 공식적으로 공유하지는 않았다. 뭐, 그게 아니라도 구글 애널리틱스로 확인할 수 있지만. 퇴사한 지 반년 넘어서 지금은 잘 모르겠다만. 데이터가 많이 쌓이긴 한 것 같은데 그걸 정밀하게 분석해서 전략적으로 활용한다는 느낌이 크게 들지는 않았다. 대표는 그걸 분석할 수도 있겠지만. 어떤 경향은 대략 보일 수 있다. 그러나 그걸 독자에게 직접 물어보고 답변을 듣는 것과 안에서 지레짐작하는 건 다를 수도 있고.

넷플릭스의 시네 매치 사례를 보다가 '지표가 좋은 콘텐츠뿐만 아니라 그렇지 않은 콘텐츠를 분석하고, 그걸 콘텐츠로 만드는 것도 괜찮지 않을까'란 생각이 들었다. 그 회사뿐만 아니라 모든 콘텐츠 서비스에 대한 생각이다(이미 있는 곳도 있지만). 조회수가 많다면, 결제가 많이 유도됐다면 왜 그런지. 신규 가입자에게는 왜 구독 신청했는지, 어떤 분야 콘텐츠에 관심 있는지, 혹은 앞으로 보고 싶은지 등을 간단히 체크하게 하고. 특정 콘텐츠를 봤으면 만족도와 내용 충실도 등을 체크하고, 거기에 기반해 관심 갈만한 콘텐츠를 추천하는 등.

사진=픽사베이

온라인 쇼핑몰 추천 알고리즘에 대한 글을 읽다가 그런 생각이 들었다. 사이드 프로젝트로 하는 어떤 서비스도 신뢰도 평가에 기반한 큐레이션을 고민하고 있고. 신뢰도 평가 항목, 큐레이션 문구를 만들고 다른 사람이 그걸 다듬어 시제품에 적용하는 걸 보다가 이런저런 생각이 들었다. 어떤 쇼핑몰에서는 고객이 본 상품 데이터나 고객이 구매한 상품 데이터에 기반해 추천 상품을 보여준다. 그러나 고객이 그 상품을 보거나 샀다고 해서 그 상품에 만족했다고 볼 수는 없다. 그에게 필요한 상품이 아닐 수도 있고.

특정한 행동은 있지만 그게 어떤 의미인지 이끌어 내야 한다. 왜 장바구니에 담아두기만 하고 사지 않는지도 그렇고. 데이터가 그 실마리를 줄 수 있는데, 물론 적절한 데이터가 있어야 하고 그에 대한 설명도 가능하겠지만. 그런 데이터가 없다면 그걸 쌓아야 하고. 데이터라도 있으면 다행이다만. 데이터가 있는데도 그걸 잘 활용하지 못하면 그건 그거대로 낭비가 될 수 있다. 콘텐츠 지표도 구체화돼야 사용자를 더 정밀하게 분석할 수 있을 듯하다. 만족도뿐만 아니라 완독률도 필요하고. 필요하다면 만족도를 조사하면 포인트를 소액 주거나.

아무튼 데이터 분석에 너무 무지한 나이기 때문에. 그 눈을 키우고 싶다는 생각을 자주 한다. 언젠가 기자협회에서 한경닷컴 뉴스래빗팀 선배들을 불러 강연한 적이 있다. 거기는 뉴스룸을 엔지니어에게 개방했다. 엔지니어가 기자도 하고. 코딩할 줄 아는 기자다 보니 이미 개방된 공공 데이터를 활용, 분석해서 새로운 뉴스거리를 만든다. 기자들은 홍보팀 통해 데이터를 받아서 기사를 많이 쓴다. 그러나 자기가 코딩할 줄 알면 스스로 데이터를 찾아 분석해서 그 누구도 쓸 수 없는 자신만의 뉴스거리를 발굴할 수 있다는 장점이 있다.

그 강연을 들으면서 뉴스래빗 선배들이 참 멋졌다. 그 말이 지금도 기억에 남는다. 어떤 사람들은 "그래서 기자가 코딩을 배워야 합니까?" 이런 질문도 하는데 그럴 필요 없다고. "엔지니어에게 뉴스룸을 개방하세요"라고. 그때쯤이었나. 그 전이었나. 커넥트 재단의 '소프트 에듀 페스트'에서 80대 일본 할머니 개발자가 기조연설을 했는데 그것도 인상적이었다. 배움에 나이가 따로 없기도 하고. 현실은 장난감이나 게임으로 배우는 코딩도 버벅거리는 나란 존재가 있을 뿐이지만.

문과생~에서는 기계가 대신할 수 없는 영역 이야기도 다뤘다. 그 내용은 많이 도전이 됐다. 이와 관련해 인간의 인문학적 판단 중요성도 강조한다. 물론 기술과 인문은 함께 가야 한다고 하고. 사람만 할 수 있는 일이 뭔지 고민을 많이 던지는 시대라서 이런 내용에 눈길이 갔다. 내가 해오던 일도 기술이 더 고도화되면 대체 가능한 일이니까. 인공지능 회사에서 AI로 글을 안 쓰고 내게 글 맡기는 걸 보면 '아직 시간이 더 필요한가 보다' 싶지만. AI가 작곡도 하고 그림도 그리며 소설도 쓰는 시대가 됐으니. 사람만 쓸 수 있는 글을 써야 하는데.

사진=픽사베이

저자는 사람만 할 수 있는 역할을 이렇게 설명했다. "기계를 학습시키는 것도 사람이고, 결과를 책임지는 것도 사람이고, 기술이 알려주는 데이터를 기반으로 전략을 세우는 것도 사람이며, 신제품의 디자인을 결정하는 것도 사람이다. 사람이 해야 하는 최소한 기능은 계속 남아있을 것이고, 그 최소한의 기능이 사실 가장 중요한 영역일지도 모른다. 바로 인간의 판단력이나 창의성과 맞닿아 있는 지점이다." 이 부분을 읽으니 '대학에 가는 AI vs 교과서를 못 읽는 아이들' 내용도 떠올랐다. 그 책 저자는 그 영역으로 '창업'을 이야기하던데. 창업은 '어떤 문제를 해결'하는 데서 출발하는 경우도 많은데 그건 사람이 할 수 있는 분야이긴 한 듯.

데이터 분석에서 사람의 인문학적 판단이 가지는 중요성도 인상 깊은 내용이었다. "시간과 노력으로 하던 일을 기계가 대신해주는 만큼 사람만이 갖고 있는 고유의 사고력이 더 많이 요구된다"라고. "기계가 알아서 학습을 하고 있다면 '무엇을 학습해야 하는지', '학습한 데이터로 시장에 무엇을 내놓아야 하는지' 같은 결정이 나 자신은 물론이고 다른 기업과의 차이도 만들어낼 수 있다"라고. 기술이 더 발전하면 이런 것도 기술이 제안할 수도 있다. 그러나 그 기술을 관리할 최소 인력이 되려면 사람은 더 똑똑하고 탁월해져야 할 것 같다.

특히 문과생~ 뒷부분에서는 데이터 일반론뿐만 아니라 업에 대한 이야기를 한다. 자신이 좋아하는 일을 한다는 것, 회사를 다닌다는 것, 일을 잘한다는 것, 첫 직장이 중요한 이유 등. 데이터 사이언티스트에 관심 없더라도 일을 고민하는 사람에게 두루 유용한 내용이다. 특히 내게 맞는 일을 찾기 위해서 직접 행동하면서 데이터를 쌓아보라고 강조하는데 그 내용이 와 닿았다. 아이디어~에서는 시장에서 먹히는 아이디어를 찾는 수단으로 프리토타입 중요성을 강조한다. 내일보다는 오늘 테스트하라는 점에서 문과생~과 목소리가 비슷했다.

독서노트에 표시했다고 생각했는데 다시 보니 제대로 안 돼 있다. 문과생~에서 인상 깊었던 관련 내용을 발췌하면 이렇다. "요즘엔 너무 정보가 많다 보니 그냥 해보기보다는 정보를 모은 뒤 최선의 선택을 하기 위해 고민하는 경우가 많다. 그러지 말고 그냥 해보면 좋겠다. 상상하는 일과 실제로 해볼 때의 일은 다르다. 경험을 해보는 것이 중요하다. 정보와 경험이 합쳐질 때 더 확신이 생긴다."

"데이터 분석가에게 데이터가 없는 것은 어떤 경우에나 치명적이다....(중략) 하지만 데이터가 없으면 일은 정말 어려워진다. 데이터를 쌓는 일부터 해야 하기 때문이다. 또 데이터는 쌓일수록 강한 힘을 갖는 속성이 있어서 지금부터 데이터를 쌓는다면 최소 1~2년 후에나 의미 있는 일을 할 수 있다. 만약 데이터가 없다면 1~2년 후에도 지금처럼 고민할 수 있기 때문에 지금부터라도 데이터를 쌓아야 한다."

사진=딱정벌레

"데이터가 없는 데이터 분석가는 흙이 없는 토기장이, 보석이 없는 보석 세공사다. 뭔가 다른 것으로 대체할 수 있을 것 같지만 데이터는 무엇으로도 대체할 수가 없다. 데이터는 다른 데이터로 대체할 수밖에 없다. 어떤 데이터라도 갖고 있어야 한다." 이 부분과 아이디어~를 읽으면서 우리 인생에도 행동 데이터를 충분히 쌓아야겠다는 생각이 들었다. 물론 아무거나 쌓으면서 시간을 낭비해서도 안 되지만. 기회가 있다면 일찍 경험하고 이게 할만한지 아닌지 빨리 판단하는 것도 필요하다 싶다. 그래야 다음 챕터로 넘어가니까.

예를 들어 갈팡질팡하고 오래 고민하다 결국 하지 않은 어떤 일이 있다. 근데 그걸 안 한 게 시간이 지나면서 너무 후회될 수 있다. '오랜 꿈을 이뤄야겠다'라고 생각하고 늦게나마 그 일에 도전한다. 뒤늦게라도 꿈을 실현해서 기쁠 수 있다. 근데 생각보다 되게 별로인 경우도 있다. 난 다 버리고 왔는데. 너무 아닌 거다(좋은 직장 다니다가 뒤늦게 기자가 된 사람 중에 그런 경우가 있었다). 물론 한 가지 길만 고집하며 다른 길은 보지도 않고 우직하게 그쪽 데이터만 쌓아 나가는 것도 단점이 있다. 그만큼 다른 가능성을 놓치니까. 한 길만 가는 것도 용기 있지만 어쩌면 그건 게으른 선택일 수 있다. 다른 걸 알아보고 준비하기 귀찮으니까 관성에 기대는 것.

아무튼 우리는 여러 가능성을 열어놓되, 자신만의 행동 데이터를 충실히 쌓아야 한다. 어차피 내 인생이고, 남의 조언을 참고할 수 있지만 그게 내게도 맞으리라는 보장은 없다. 조언은 다양하게 들어야 하고. 충분히 알아보고 경험하고 들어보지 않으면 내게 중요한 결정을 안일하게 내릴 수도 있다. 고객 행태를 분석하는 데 있어서도 데이터가 중요한데 사람은 오죽할까. 이건 좀 결이 다르지만 언젠가 첫 직장 선배가 코로나 19 시국에 대해 SNS에 이런 글을 쓰셨다. "막 해보고 싶다. 어차피 모두에게 새롭지 않냐"라고. 얼마 전 예전 동료도 비슷한 말을 했다. "코로나 때문에 모든 게 제로 베이스"라서 일단 해보고 싶은 대로 해본다고.

아무도 가지 않은 길에 미래를 더 내다보고 용기 있게 발걸음을 내딛는 사람들에게 경이로움을 표하는 바다. 모든 사람들이 다 저렇게 할 수는 없지만. 아무튼 좁게는 내가 하는 일에, 넓게는 앞으로의 삶을 두고 눈을 열어주는 콘텐츠였다. 그러고 보니 요즘은 '문과생을 위한~', '비개발자를 위한~' 이런 콘텐츠가 유독 눈에 띈다. 그런 게 잘 먹히는 듯도 하고.

근본 없이 기술 콘텐츠를 쓰는 나를 생각해본다. 종이책을 한 권 샀다. 유유 출판사에서 낸 책 목록을 읽다가 눈에 들어오는 책을 한 권 발견했다. 바로 '엔지니어의 인문학 수업'. 날 위한 책은 아니고 르네상스인을 꿈꾸는 공학도를 위한 필수 교양이란 부제가 달렸다. '엔지니어가 인문학을 공부해야 하는 이유', '엔지니어를 위한 교양과목', '픽션에 그려진 공학의 미래' 등을 다뤘다. 나온 지 몇 년 된 책인데 오프라인 교보문고에는 없고 온라인 서점에서 샀다. 기술도 잘 알고 싶지만 그걸 개발하는 사람들도 더 알고 싶다. 그래서 이 책을 샀다. 이 책이 그 답이 되지 않겠지만. 장님 코끼리 만지더라도 감 잡는 데 도움되지 않을까.

keyword
매거진의 이전글종이 신문이 내게 던졌던 고민