brunch

서비스에 데이터가 흐르게 하는 기획자가 되려면

훌륭한 기획 없이, 인공지능 또한 없다

by 여름비

기획자가 데이터도 알아야 하는 시대가 도래했다


많은 사람들이 인공지능 모델이나 머신러닝 모델을 만들기 위한 데이터가 필수적으로 어디서나 존재한다고 생각하는 경향이 있지만, 그런 데이터를 존재하게 하는 서비스 기획 없이는 인공지능의 "ㅇ" 자도 만들기 어려운 것이 현업의 현실이다. 인공지능 혹은 머신러닝 모델 자체는 어느 정도 수준까지는 쉽게 만들 수 있지만, 정말로 중요한 것은 원하는 모델을 만들기에 최적화된 그리고 정확한 데이터를 획득하는 것이다. 그리고 그런 데이터를 얻기 위해서는 정말 많은 수고와 생각 그리고 시간이 들어간다. 그리고 이러한 질 좋은 데이터를 획득하는데 가장 많은 기여를 하는 것이 나는 서비스를 기획하는 기획자라고 생각한다.


기존에 기획자의 업무 범위는 서비스 기획에 한정되어 있었다. 유저에게 어떤 가치를 전달하기 위해 이런 기획을 해야 하고, 또 이 기획이 어떻게 진행되어야 하는지에 대해 생각하는 것이 기획자가 하는 일 중에 많은 부분을 차지하였다. 하지만 근래에 들어서 많은 서비스의 핵심 기능들이 수학 모델을 사용하게 되었고, 이러한 수학 모델의 사용은 서비스 기획 단계에서 해당 서비스가 어떤 데이터를, 어떻게, 그리고 어떤 모델을 위해 만들어져야 하는지에 대한 부분도 고려해야 하게 되었다. 언뜻 듣기에는 쉬워 보이지만, 경험상 정말로 많은 부서들과 엮여 있고, 또 정말로 깊은 생각이 필요한 작업이다



좋은 데이터를 만드는 기획을 하려면


서비스 자체가 없는 상태에서, 즉 스크레치에서 시작을 한다면 모든 서비스들이 설계가 필요하듯, 데이터 또한 서비스의 목표에 맞추어서 설계가 들어가야 한다. 예를 들어서 e-commerce 앱을 만든다고 해보자. 그러면 나는 초기에 아래와 같은 것 들을 생각 해볼 것 같다


1. 이 서비스는 궁극적으로 유저에게 어떤 가치를 전달하고자 하는가?

2. 이 서비스를 위해 어떤 종류의 데이터들이 필요할까? (음성, 이미지, 행동 기록..)

3. 서비스를 통해 어떤 데이터를 내가 획득할 수 있을까?

4. 어떤 구조로 데이터를 남겨야, 나중에 쓰기 쉬울까?


결국에 데이터와 인공지능 모델 자체는 서비스의 방향에 따라 만들어지고 사용되게 되어 있기 때문에, 서비스의 장기적 방향이 무엇인지 생각해보는 것은 비단 서비스 자체뿐만이 아니라 데이터에도 굉장히 중요하다. 서비스가 B2B 이기 때문에 고객에 대한 상세한 정보를 남길 필요가 없는데, 그 정보를 남기기 위해 시간을 투자하는 것은 너무 낭비인 것처럼 말이다. 이번 예제인 e-commerce의 경우, 궁극적으로 가치를 전달하고자 하는 대상이 다수의 군중이고, 또 각 유저들에게 가장 좋은 물품을 가장 낮은 가격에 유저가 원할 때 제공한느 것이 해당 서비스가 목표로 하는 궁극적인 가치이다. 그렇기 때문에 이 서비스의 궁극적 가치를 참고하면, 당연히 고객들이 이 서비스에 와서 하는 모든 행동들에 대해서, 그리고 그 행동의 대상이 되는 상품들에 대해서 데이터를 상세적으로 남기는 것이 중요하다는 결론을 쉽게 내릴 수 있다


그렇다면 여기서 또 생각해봐야 하는 것은 "유저와 상품의 데이터는 어떤 종류의 데이터들이 있을 수 있을까?"이다. 물론 서비스마다 다르겠지만 보통 e-commerce의 유저들로부터 얻을 수 있는 데이터는 언제 어떤 행동을 했는지에 대한 문자 형식의 기록에 한정되어 있다. 예를 들어 "20200101 010001에 xx 상품 구매" 같은 형식으로 말이다. 그렇다면 상품에 대해서는 어떤 데이터들이 있을까? 크게 문자, 이미지, 동영상이 있을 수 있다고 생각한다. 해당 상품의 가격 및 이름을 나타내는 문자, 해당 상품의 이미지, 그리고 동영상을 포함한 상품이라면 상품 상세 설명 동영상 등등을 예로 들 수 있다.


이렇게 어떤 데이터들이 존재할 수 있고, 또 내가 필요한 데이터들이 무엇인지 알게 되었다면, 이다음이 정말로 기획자에게 중요한 단계들이고 또 시간도 많이 들어가는 부분들이라고 할 수 있다. 바로 필요한 데이터들을 얻을 수 있는 구조의 서비스를 설계하고, 또 그 데이터들의 구조와 룰을 만드는 것이다


예를 들어 유저의 나이 및 성별이 서비스에 중요한 데이터이기에 서비스상에서 수집되어야 한다고 해보자. 그러면 기획자는 어떻게 유저들이 회원 가입을 하면서 개인 정보를 기입하게 할지 기획해야 한다. 보기에는 쉽지만 어떻게 유저들이 데이터를 기입하는 것을 불편하게 느끼지 않도록 하고 또 어떤 경로에 어떤 형식으로 회원가입을 유도하게 할지 등의 수많은 서비스적 고려가 동시에 진행되어야 한다.

유저가 어찌어찌하여 성별 및 나이에 대해서 기입을 하게 되었다고 해보자. 그러면 그러한 데이터 기입 행동을 하였다는 기록은 어떤 형식 혹운 구조로 기록되어야 나중에 분석을 하거나 인공지능 모델에 쓰기 쉬울지 생각해보아야 한다. 예를 들어 "회원가입" 보다는 "메인 페이지에서 유입되어 카카오톡으로 가입" 이 더 괜찮은지, 아니면 그냥 "1-10 가입" 형식으로 기록되는 것이 괜찮은지 서비스의 맥락에 따라 결정을 해야 한다. 보기에는 쉽지만 처음에 명확하게 "우리는 이런 룰과 형식을 따라서 데이터를 남길 것이다"라는 게 없이 그때그때 데이터 기록 형식을 정한다면 나중에 모조리 다 다시 기록해야 하는 상황이 올 수도 있다



서비스 인프라의 한계를 고려하기


사실, 위의 모든 것을 완벽히 고려하여 데이터를 기획하고 설계하였더라도 서비스의 데이터 인프라가 받쳐주지 않는다면 해당 데이터를 쉽게 쓰기 어렵게 된다. 예를 들어 1 테라 바이트의 유저 행동 기록이 있다고 하더라도 그것을 불러오는데 몇 시간씩 걸린다면 사실 사용하지 못하는 데이터이나 마찬가지 이기 때문이다. 그렇기에 초기부터 수집하는 데이터가 어떤 종류이고, 얼마나 크고, 또 어떤 방식으로 사용될지 데이터 인프라 팀과 논의하는 것이 중요하다



결론적으로..


물론, 위와 같은 모든 것을 고려하면서 서비스 개발을 잘 진행할 수 있는 기획자가 그렇게 많지는 않겠지만, 단지 참고하는 것만으로도 데이터의 질을 많이 높일 수 있다고 생각한다

keyword
이전 04화정말로 데이터를 잘 사용 하려면, 이 질문을 하라