지난 1년 넘게 독학으로, 패스트캠퍼스 국비 과정으로 AI 데이터 사이언스 과정을 공부해왔다. 아직 멀었다고 생각하지만 예전과는 달리 어떤 서비스나 플랫폼에 AI 기술이 들어갔다고 하면 그닥 신기하게 여기거나 생소하게 여기지 않는다.
몇 년전만 해도 광고 플랫폼들이 무슨 강화학습을 도입해서 최적화했다고 하는 해외 기사나 블로그 등를 보면 그냥 '아, 무슨 머신러닝을 사용했는가 보다' 하고 나랑은 상관없는 먼가 벽이 느껴졌는데 지금은 좀 더 자세히 써줬으면 하는 생각도 든다. 머신러닝이나 딥러닝 기술은 최근 몇 년동안 광고 마케팅 업계에서도 많이 사용되서 지금은 굳이 자세히 말하지 않아도 제품을 보조하거나 새로운 기능을 런칭하는 데 쓰이고 있다.
대표적인 광고 플랫폼인 구글과 페이스북의 유사타깃이나 관심사, 구매의도 타깃팅이 그렇고 이들 플랫폼의 최적화 과정 역시 머신러닝 기반으로 돌아간다. Amplitude과 같은 인앱 분석툴은 머신러닝 기반으로 사용자의 구매확률과 이탈률을 예측해 마케터로 하여금 미리 액션을 취할 수 있게끔 하고, Braze와 같은 개인화 마케팅 플랫폼은 사용자가 가장 반응할 가능성이 높은 타이밍과 채널에서 미리 정해놓은 마케팅 메시지를 내보낼 수 있도록 도와준다.
https://www.braze.com/product/optimization
그야말로 데이터를 기반으로 사용자를 분석하고 타깃화된 마케팅 활동을 할 수 있으며, 실시간으로 고객이 원하는 것을 제안하거나 개인화된 메시지를 내보낼 수 있는 것이다.
물론 마케터라면 여기에 사용되는 머신러닝이나 딥러닝 기술에 대해 자세히 이해할 필요는 없다. 마케터에게 중요한 것은 데이터와 기술(tech)을 활용해 마케팅을 좀 더 성과 측정가능하고 비즈니스를 성장시키는 방향으로 가는 것이니까 말이다.
A lean startup's growth marketing tech stack
하지만 앞서 이야기했다시피 마케팅의 많은 부분이 데이터 기반으로 자동화되고 있다. 광고 플랫폼에서부터 이를 추적하기 위한 광고 트래킹툴, 인앱 분석툴, 그리고 고객의 데이터를 통합하기 위한 고객 데이터 플랫폼(CDP), 마케팅 자동화 플랫폼까지 마케팅에서 데이터가 차지하는 비중이 커지고 있다. 이에 따라 마케터가 데이터의 수집과 활용, 마테크 동향에 대해 이해하고 데이터베이스에서 직접 필요한 데이터를 추출할 수 있는 SQL 등의 기본 능력이 점차 중요해지고 있는 것 같다.
이 때 마테크에 들어간 머신러닝, 딥러닝과 같은 기술을 생소하게 여기지만 않으면 된다. 앞으로 점차 설명하겠지만 머신러닝, 딥러닝 같은 인공지능은 컴퓨터에게 컴퓨터가 잘하는 계산을 이용해서 데이터에 있는 패턴, 규칙을 발견하도록 해 예측하는 방법들일 뿐이다.
난 내가 마케터를 그만 두고 지금 데이터 사이언스를 공부하지만 비전공자로서 아무런 백그라운드 없이 머신러닝 알고리즘들을 공부하려고 할 때 쉬운 책이 하나도 없었던 것 같았다. 어느 정도 선형대수학이나 통계학 등에 대해 배경 지식을 갖추고 있어야 하거나, 시작을 위해 하이레벨 컨셉에서 이런 머신러닝 알고리즘들을 왜 쓰는 지, 머하는 것이지에 대한 전혀 감이 없이 바로 개별 알고리즘 내용들에 대해 이야기하다보니 내용이 어렵고 잘 와닫지 않은 게 사실이다. 머신러닝에 대한 경험이 1도 없으니 당연한 일일 것이다.
그래서 앞으로 거의 매주 마케터를 위한 머신러닝, 딥러닝 사전을 하나씩 연재해 보고자한다. 목표는 마케터와 같은 비전공자가 머신러닝, 딥러닝이라는 말을 들었을 때 그닥 생소하게 여기지 않고 아니, 별 거 아닌 걸로 여길 수 있는 것이다. 또한 셀프 서브드 툴 등을 사용해 직접 머신러닝을 돌려보려고 할 때 사전처럼 참고할 수 있는 내용들을 적어보는 것이다.
욕심 있는 마케터라면 마테크 플랫폼이 지원하는 기능 혹은 알고리즘 말고도 자사 서비스에 필요하다고 생각하는 커스텀 알고리즘을 만들어 볼 수 있을 것이다. 구현을 위해 내부 혹은 외부 마테크 플랫폼과 상의할 수 있고 혹은 코딩하지 않아도 되는 래피드 마이너, MS 아주어 머신러닝 스튜디오 등과 같은 셀프 서브드툴을 이용해 간단한 알고리즘을 만들어 테스트해 볼 수도 있을 것이다.
데이터 사이언티스트는 알고리즘의 원리를 수식적으로도 이해하고 유도할 수 있어야 하겠지만, 머신러닝 딥러닝 사전은 하이레벨에서 각각의 알고리즘이 무엇이고, 어떻게 작동하는 지, 주로 어떤 곳에 사용하는지 등에 대해 설명해보고자 한다. 그리고 사용자의 구매확률과 이탈률, 어트리뷰션툴의 Predictive modeling, 아마존의 추천 알고리즘 등 광고 마테크 업계에서 사용되는 머신러닝, 딥러닝 기술을 적절히 섞어서 이야기해보고자 한다.
마테크를 활용하는 데 관심이 많은 분들, 직접 셀프 서브드툴을 활용해 보고 싶은 분들, 마케팅 데이터 분석 혹은 마케팅 데이터 사이언스 쪽으로도 공부하고 싶은 많은 분들이 봐주시고 의견도 주시면 좋을 것 같다.