brunch

You can make anything
by writing

- C.S.Lewis -

by 호달 Oct 14. 2020

데이터 친화적인 조직이 되려면?

- 데이터 구조 기획이라 쓰고 데이터 문화 만들기라고 부른다 -

이곳에서 일하면서 한 가지 느낀 사실이 있다. 데이터도 각자의 핏을 맞춰야 효율적으로 활용할 수 있다는 점이다. 특히 커머스인 이곳은 일반 IT서비스와 달리 다양한 직군이 있어 핏을 맞추기는 더 어렵다. 각 팀의 직군에 따라 데이터의 중요도와 필요도가 달라 발생한 데이터를 처리하는 방식이 각각 다른 이유에서이다.


#그림 상황설명

A팀에서 발생하는 데이터와 B팀에서 발생하는 데이터는 다르다. A팀의 경우 B팀의 DATA6이 필요하고, B팀의 경우 A팀의 DATA3이 필요하다. 하지만 각 팀이 데이터 별 중요도가 달라 서로 필요한 데이터를 제외하고 공유한다. 결과적으론 A팀과 B팀은 활용할 수 있는 데이터가 1개씩 줄어들게 된다.


위의 상황과 같이 서로 업무 하는 배경이나 환경이 달라 데이터를 보는 관점이 다르고 결과적으론 각 팀이 활용할 수 있는 데이터가 줄어들게 된다. 여기서 더 큰 문제는 각 팀이 필요한 데이터를 어떤 팀에서 발생하는지 정확히 이해한다면 따로 요청할 수 있지만, 잘 몰라서 활용해보지도 못할 수 있다는 점이다. 이런 문제점을 해결하고자 전사적으로 일하는 플로우에 맞춰 어떤 데이터가 발생하고, 적재하며, 활용할 수 있는지 구조적으로 정리해보았다.


데이터 발생지 찾기


필요한 데이터는 어디서 발생할까? 이를 명확히 파악하기 위해선 전사적으로 일하는 플로우를 알아야 한다. 이곳의 경우 '고객에게 상품을 판매한다'라는 큰 틀을 가지고 각 팀의 업무 플로우가 정해진다. 고객에게 전달할 상품을 준비하는 역할은 상품팀이 맡는 것처럼 각 팀의 역할이 정해진다. 역할이 정해지면 각 팀은 역할을 수행하고 이때 데이터가 발생한다. 예를 들면, 상품팀이 상품을 준비하는 과정에서 상품에 대한 정보가 발생하는 것과 같다(A상품은 어떤 소재인지, 어떤 색상인지, 어떤 형태인지 등). 

이처럼 각 팀이 역할을 수행하면, 각 업무와 관련 있는 다양한 데이터가 발생한다. 이러한 데이터가 어디서 발생하는지를 나열해보면 더 세부적으로 응용할 수 있는 방법이 떠오른다. 또한 각 팀에서 발생하는 데이터가 서로 어떤 연관성이 있는지 알 수 있어, 데이터 핏을 맞출 수 있는 배경이 된다.


데이터 환경 이해하기


어떤 업무에서 데이터가 발생하는지를 파악했으면 이를 활용할 방법을 찾아야 한다. 하지만 활용방법은 데이터를 얻는 환경에 따라서 달라진다. 여기서 '데이터를 얻는 환경'이란 데이터를 따로 관리해야 하는지, 꾸준히 수기로 넣어야 하는 데이터인지, 자동적으로 쌓이는 데이터인지, 전처리가 필요한 데이터인지 등을 의미한다. 예를 들어, 매출 데이터는 결제시스템을 통해 자동으로 쌓이는 데이터지만, 상품에 대한 정보는 상품을 가져오면서 활용하기 쉽도록 관리해야 하는 데이터이다. 이렇듯 데이터를 가져오는 환경은 다양하기 때문에 특징을 통해 명확히 이해할 필요가 있다. 나의 경우 데이터를 얻는 환경을 '수동적재데이터'와 '자동적재데이터' 2가지의 큰 타이틀로 정리하였다.


#수동적재데이터

업무를 통해 발생되는 데이터지만, 부가적인 노력을 통해 관리해야 하는 데이터 즉 방치하면 없어지는 데이터

ex) 상품정보, 품번, 거래처 정보 등


#자동적재데이터

플랫폼, 매체, 프로그램 등에서 자동적으로 데이터 프레임에 적재되는 데이터

ex) 자사몰 매출 데이터, 자사몰 회원 데이터, 페이지뷰 등


위와 같이 2가지의 큰 타이틀로 정리한 이유는, 단순히 1단계 분석으로만 끝내지 않고 더 많은 것을 알 수 있다는 걸 이해시키기 위해서다. 데이터를 활용하기 가장 쉬운 방법은 그냥 있는 데이터를 활용하는 것이다. 그런 의미에서 자동적재데이터는 가장 기초적인 데이터다. 매출 데이터를 통해서 어떤 상품이 잘 팔렸는지, 특정 상품에 관심 있는 회원은 누구인지 등을 알 수 있다. 하지만 어떤 상품이 어떤 이유(어떤 특징을 가졌길래?)에서 잘 팔렸는지는 정량적으로 보기 어렵다. 만약 상품의 특징을 구조적으로 관리한다면, 매출 데이터에 상품의 특징 데이터를 같이 엮어서 그 특징을 정략적으로 볼 수 있게 된다. 여기서 짚고 넘어가야 할 부분은 앞서 언급한 데이터 발생지다. 수동적재데이터가 발생하는 팀의 경우 발생하는 시점에 구조적으로 데이터를 관리해주어야 한다. 데이터 친화적인 문화를 가진 회사의 경우 데이터 발생 시점과 환경에 대한 이해가 명확해 작업이 원활하게 이루어진다. 하지만 반대의 경우 이런 과정이 원활하게 이루어지지 않을 가능성이 높다. 따라서 각 팀에게 필요성을 이해시키고 직접 적재를 해야 하는 것을 인정해줘야 한다.


요약하자면, 데이터를 얻는 환경을 명확히 파악하고 각 팀이 이 부분을 이해하고 있어야 데이터를 적재하는 과정에 문제가 생기지 않고 다음 스텝으로 넘어갈 수 있다.

    

목적을 명확히 하기


데이터는 모든 걸 해결해줄 수 있는 만능키는 아니다. 데이터를 해석하는 방식, 도출하고자 하는 결론에 따라 의미가 다르기 때문이다. 하고 싶은 말을 하자면, 데이터는 명확한 목적이 있을 때 이를 근거할 수 있고, 검증할 수 있는 수단으로 활용되는 것이지 데이터를 보면 갑자기 무언가 해결되는 요술램프가 아니다는 것이다.  데이터를 마음대로 활용할 수 있는 배경이 완성되면 목적의식을 가지고 그에 맞게 활용할 방법을 찾으면 된다. 

위 그림으로 설명하자면, '신규 가입자를 충성고객으로 만들자'라는 목적이 있으면 실행 단계로 넘어가는 근거 지표로 활용되는 것이 데이터다. 즉 목적이 불명확하면 도출과정 역시 명확하지 않아 제대로 된 실행을 할 수 없다. 


데이터 토양학 개론


조직을 데이터 친화적으로 만드는 방법은 다양하다. 조직의 문화, 환경에 따라서 시작점이 다르고 적용 방법이 다르다. '데이터 토양학 개론'이라고 표현한 이유는 데이터를 근거로 잘 활용하기 위해선 전사의 노력이 가장 중요하고 앞서 언급한 방식과 같이 전사적 이해와 노력이 필요하기 때문이다. 1단계 분석에서 2단계, 3단계로 넘어갈 수 있으려면 앞서 언급한 내용 중 하나라도 제대로 이루어지지 않으면 불가능하다. 분석은 그로스적 마인드가 갖춰진 사람이라면 누구나 할 수 있지만, 토양을 만드는 건 누구나 할 수 있는 일이 아니다. 이러한 환경을 만들기 위해선 한 사람의 기획과 노력에서 끝나는 게 아닌 전사적인 관심과 노력이 중요하다.




데이터 토양이 마련되지 않은 조직에서 차근차근 나아가는 것은 개인의 의지와는 별개인 문제인 것 같다. 하지만 다양한 방식으로 데이터 환경을 이해시키고 중요성을 알리려는 노력을 겸해보고 있다. 언젠가는 핏이 맞아 1단계 분석 그 이상을 할 수 있으리라 상상해본다.

지금까지 토양 작업을 같이 고민하고 또 고민을 계속해줄 팀원들에게 감사의 인사를 전하며...

매거진의 이전글 Jenkins로 이런 것도 해볼 수 있다?

매거진 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari

브런치 로그인