brunch

매거진 티맵 피플

You can make anything
by writing

C.S.Lewis

by 티맵모빌리티 Jun 14. 2023

스타트업 데이터 사이언티스트는 무슨 일을 할까?

티맵모빌리티 조직인터뷰 2편. Data Intelligence팀

국민 내비 TMAP이 티맵모빌리티로 독립한 지 벌써 2년이 넘었어요. 20년 역사의 대단한 서비스를 만들어가는 것. 벅차지만 쉽지 않은 여정 속에서 티맵 피플들은 어떤 고민을 하고 어떤 미래를 그려가고 있는지 하나씩 풀어나가 보려고 합니다. 

Q. 안녕하세요. 오늘은 Date Intelligence(이하 DI)팀을 모셨습니다. 각자 자기소개 부탁드려요.


세희: 안녕하세요. 데이터 엔지니어 겸 서버 개발자 이세희입니다.

예진: TMAP 화물 서비스의 모델링을 맡고 있는 데이터 사이언티스트 이예진입니다.

수현: 프로덕트를 분석하는 데이터 애널리스트 조수현입니다. 

성원: TMAP 대리의 모델링을 맡고 있는 데이터 사이언티스트 장성원입니다.

(왼쪽부터 세희님, 예진님, 수현님, 성원님)

Data Intelligence팀은 티맵의 데이터와 경로를 분석 및 모델링하여 
여러 서비스에 제공하는 일을 해요.


Q. 자기소개를 들으니 ‘데이터’를 만지는 분들이 모여계신 팀이라는건 알겠네요. DI팀은 어떤 일을 하는지 구체적으로 소개해주세요. 


세희: 한문장으로 정의하자면 DI팀은 티맵의 데이터와 경로를 분석 및 모델링하여 여러 서비스에 제공하는 일을 해요. 감이 잘 안 오시죠? 팀 내 각 파트별로 나눠서 설명 드릴게요. 오늘 참석한 4명이 각 파트의 대표거든요. 


먼저 제가 맡은 엔지니어 파트에서는 각 서비스에서 대리, 화물 가격을 정할 수 있도록 하는 시스템을 개발하고 있습니다. 모델링이 필요한 외부 데이터 연동과 처리, 외부 제공용 API 개발, MLOps 플랫폼 ab 테스트 개발 등 다양한 업무를 하고 있고요. ml과 딥러닝 모델 서빙 플랫폼도 제공하려고 하고 있습니다.


Q. 대리 부르면 나오는 추천요금 같은 것과 관련이 있는 건가요?


세희: 그건 모델링 쪽과 더 밀접하게 관련이 있고 저희는 시스템이에요. 응답을 요청했으면 응답을 주는 전체 과정들, 그리고 거기에 필요한 데이터를 다루는 거죠. 학습을 위한 데이터와 실시간 데이터 등이요. 예를 들어, 비가 온다거나 날씨가 안 좋으면 그런 정보도 다 반영이 되어야 하잖아요(가격이 오르겠죠). 그래서 날씨 데이터 등을 개발자들이 수집해서 쌓아놨다가 실시간 요청이 들어오면 오늘 날씨를 확인해서 입력해요. 그러면 모델에서 계산해서 응답을 주겠죠? 그런 과정 전반을 다루는게 엔지니어 파트입니다. 

데이터 엔지니어 겸 서버 개발자 세희님

예전에는 수작업으로 이루어지던 화물 서비스를 AI 모델로 디지털화하고 있어요.


Q. 화물 모델링 파트에서는 어떤 일을 하시나요?


예진: 화물 모델링 파트에서는 화물 서비스 데이터를 분석해 서비스 활성을 위한 Data-driven 의사결정을 돕고, 화물 프로덕트의 AI transformation을 위한 모델을 개발해요. 예를 들어, 단가 모델 같은 것들이요. 그리고 화물 프로덕트에서 AI 모델을 도입할 수 있는 분야가 뭐가 있을지 리서치하고 적용하는 일을 있습니다.


Q. TMAP 화물이 100만건 이상의 화물 빅데이터로 배차가 잘되는 최적의 운임을 제공하기 때문에 배차 성공률이 90%가 넘는다고 하던데, 그 성공률을 높이기 위한 단가 시스템을 만드시는거죠?


예진: 네 맞습니다. 예시를 보여드리자면, TMAP 화물 홈페이지에서 톤 수와 종류를 입력하고 운임료 미리보기를 누르면 예상 운임료가 뜨는데요. 이런 모든 단가가 사용자가 입력한 정보 이외에 현재 날씨와 수요 및 공급 같은 요소들까지 고려한 현재 시점의 최적 단가거든요. 이 최적 단가를 산출하는 모델을 만드는거죠. 예전에는 수작업으로 이루어지고 담당자의 판단에 근거했던 것들을 디지털화 시키는 거예요. 

최적 단가를 볼 수 있는 TMAP 화물 홈페이지

Q. 그럼 기존의 화물 시장에서는 전화가 오면 담당자가 주변 기사님 파악해서 거리와 중량에 따른 가격을 임의로 책정해주던 시스템인가요?


예진: 보통은 이전 배차 가격으로 배차를 진행하는 경우가 많아요. 현재 기사님이 주변에 어느 정도 있겠다는 것까지는 파악하기 어렵고요. 

데이터 사이언티스트 예진님

승객이 대리를 호출하면 콜을 배정해야 하잖아요.
어떤 선호를 가진 기사님이 콜을 잘 받을지 AI 모델을 만드는거죠.


Q. 대리 모델링 파트로 넘어가 볼게요. 


성원: TMAP 대리 써보셨나요? 대리운전 서비스는 승객과 기사를 연결하는 게 본질이에요. 그래서 대리 모델링 파트에서는 어떻게 하면 승객과 기사를 더 효율적으로 연결할 수 있을지 고민해서 AI로 풀 수 있는 형태로 재정의하고, AI로 해결하는 일을 하고 있습니다. 


예를 들어, 티맵대리 부를 때 추천요금이 뜨잖아요. 승객이 해당 가격으로 대리를 호출하면 콜을 배정해야 하는데요. 이 때 어떤 선호도를 가진 기사님에게 추천하면 가장 콜을 잘 수락할지 AI 모델을 만드는거죠. 이렇게 AI모델의 정확도를 높이다 보면 연산량이 늘어나 속도가 느려지고 비용도 증가해서 오히려 사용자에게 안 좋은 경험을 제공할 위험도 있는데요. 그래서 저희는 속도/비용도 함께 고려해 효율적인 모델을 만들기 위해 노력하고 있습니다. 


Q. 20초 번개배차와도 관련이 있는건가요?


성원: 관련이 있죠. 20초 안에 배차를 가능하게 하려면 승객의 요청에 적합한 기사님을 빠르게 찾아서 연결해야 하니까요. 이를 위해 ‘요금모델’‘배차모델’을 활용하는데요. 요금모델은 승객과 기사님이 모두 만족할 수 있는 적정 요금을 추천하는 역할을 하고, 배차모델은 출발지 및 도착지와 요금이 정해진 승객의 콜에 대해 가장 적절한 기사님을 빠르게 찾아주는 역할을 합니다.

데이터 사이언티스트 성원님

서비스 단에서 문제가 발생하면
데이터 분석을 통해 개선 방향을 찾아요.


Q. 프로덕트 분석 파트는 어떤 업무를 하실까요?


수현: 프로덕트 분석 파트에서 하는 일 첫번째는 서비스 분석 관점인데요. 서비스단에서 발생하는 문제를 정의하고 가설을 세운 후, 그 가설을 서비스 데이터로 검증해요. 그리고 그 결과를 토대로 서비스가 개선되는 방향으로 의사결정을 할 수 있도록 돕고 있습니다. 


두번째는 모델링 관점에서 TMAP 대리의 적정 요금을 추천해주는 다이나믹 프라이싱(Dynamic Pricing) 모델 분석을 담당해요. 가격 모델이 시장의 수요 공급에 따라 탄력적으로 움직이고 있는지를 트래킹 하기위한 지표를 개발하기도 하고, 모델의 pain-point를 찾아 개선안을 제시해서 모델을 고도화 하는데에도 기여하고 있어요. 


세번째는 데이터 관리 운영 업무예요. 기획이나 사업 부서에서 서비스 데이터를 편하게 보실 수 있도록 대시보드를 만들고, 그에 필요한 마트 테이블도 만들어 제공해요. 그리고 원천 데이터에 변화가 있을 때 마트테이블에 이를 반영하거나 수정하는 운영성 업무들도 맡고 있습니다.

데이터 애널리스트 수현님


Q. 요즘 DI팀에서 새롭게 시도하고 있는 것들이 궁금해요. 대리 모델링 파트에서는 어떤 프로젝트를 하고 계시나요?


성원: 티맵대리에 AI 배차 시스템을 도입했어요. 이전에는 승객(콜)과의 거리가 가까운 순으로 기사님을 배정했었는데요. 이 방법은 승객에게 가까운 기사님을 빠르게 배정해줄 수 있다는 장점이 있지만 콜에 대한 기사님들의 개인별 선호를 반영할 수가 없었어요. 


예를 들어, 콜과의 거리가 1km 떨어진 A 기사님은 도보로만 콜을 수행하고, 1.5km 떨어진 B 기사님은 킥보드를 이용한다고 하면 B 기사님을 배정하는게 나을 수 있잖아요. 이런 경우 멀리 있는 기사님이 콜에 대한 선호도가 더 높을 수 있는 거죠. 또는 콜의 목적지에 따라 기사님들의 선호가 다를 수도 있어요. 퇴근을 위해 자택 쪽으로 가는 콜을 잡고 싶다거나 선호하는 지역이 있을 수 있죠. 이런 여러가지 요소를 총망라해서 콜을 배차하는 것이 거리만을 고려하는 것보다 더 좋겠다고 판단했어요.


Q. 성과는 어떤가요?


성원: 시장에 경쟁이 치열하다 보니 기사님이 일단 배차를 수락한 이후에 수락한 콜이 마음에 들지 않으면 취소하시는 경우가 있는데요. AI 배차를 도입한 이후 기사님들의 취소 비율이 낮아진 것이 지표로 나타나고 있어요. 전에는 가까운 거리에 콜을 수행할 기사님이 안계시면 기사님의 개인별 선호와 관계없이 더 멀리 배차를 진행했는데, 지금은 ‘먼 거리에 있는 콜’을 선호하지 않는 기사님에겐 배차하지 않거든요. 


지표 상승뿐 아니라, 기사 커뮤니티에서도 좋은 반응이 나타나기 시작했어요. 티맵이 똑똑해졌다거나, 오늘은 티맵콜만 운행했다는 내용의 글이 올라오기도 하더라고요. 티맵콜을 운행하시는 기사님들이 늘어남에 따라 서비스 품질이 개선되어 승객도 늘어나는 선순환 구조를 만드는데 기여하고 있다고 생각합니다.

데이터 사이언티스트 성원님

Q. 화물 모델링 파트에서도 AI transformation 프로젝트를 진행하신다고 들었어요.  


예진: 화물 단가 모델링에 대한 고도화를 중점적으로 진행하고 있어요. 화주(물건 소유주, 화물을 보내는 사람)와 차주(차량 소유주, 화물을 운송하는 사람) 사이의 운임에는 여러 종류가 있고, 따라서 화물운송단가 모델에는 종류가 굉장히 많아요. 그리고 모델을 통해 최적단가를 예측한다 하더라도 화물 산업의 특성상 주선 담당자의 판단에 따라 배차를 시도하는 경우가 여전히 많습니다. AI transformation이 보편화되지 않아서 모델의 결과가 아닌 주선 담당자의 경험을 토대로 운임을 산정하는 거죠.


Q. 아직도 수기로 진행되는 부분이 많은 거군요. 기존의 관성이 있으면 좋은 기술이 있어도 보편화되기가 쉽지 않겠어요. 


예진: 맞아요. 그래서 ‘어떻게 하면 이런 기능을 사용하게 할까?’, ‘사용하지 않는 이유는 뭘까?’를 계속 고민하면서 확산시키기 위한 노력을 하고 있고요. 추가로 모델을 도입할 수 있는 기능이 있는지 사업팀과 긴밀히 소통하면서 화물 AI transformation을 위해 노력하고 있습니다. 


Q. 세희님, 엔지니어 파트도 새롭게 시도 중인 것들이 있을까요? 


세희: ML/DL 기반 서빙 플랫폼 고도화를 계획하고 있어요. 대리/화물 모델 서비스에서 나아가서 현 시점에서 가장 필요한 추천 서비스를 기반으로 플랫폼을 확장하려고 해요. 사용자의 현재 위치, 목적지, 취향 등을 고려해서 적절한 POI(장소 정보)를 추천해 주는거죠. ‘이 유저는 보통 이 시간에 커피를 마시러 가니까 카페를 추천해줄까?’ 이런 식으로 유저의 정보를 기반으로 어떤 추천을 할지 AI로 모델링 하는 거예요. 


데이터 분석에는 굉장히 종합적인 시각이 필요해요.


Q. 위와 같은 일들을 진행하면서 힘든 부분도 있을 것 같아요. 어려운 과제들을 어떻게 극복하고 계신가요?


수현: 정확하지 않은 데이터가 공유되고 있을 때요. 데이터를 누구나 편하게 볼 수 있도록 하는 것이 제 역할이긴 한데, 역설적이게도 그래서 생기는 문제들도 있어요. 데이터라는건 굉장히 종합적인 시각이 필요하거든요. 


데이터를 뭉뚱그려서 봤을 때와 쪼개서 봤을 때의 결과가 다를 수 있고, 기간을 어떻게 보느냐에 따라 해석이 달라지기도 해서 항상 여러 방면에서 종합적으로 분석해서 결론을 내야 해요. 그런데 데이터를 자주 보는 사람이 아닐 경우 단편적인 부분만 보고 좋다 나쁘다 결론을 낼 수 있고, 그것들이 회사 내에서 공유될 수 있어요. 그래서 슬랙 스레드에 데이터 관련 공유가 있을 때 꼼꼼하게 읽어보고, 결과에 대한 코멘트를 남기면서 최대한 편향이 없는 결과가 공유될 수 있도록 노력하고 있습니다. (여기저기 부서를 넘나들며 오지랖을 부리고 있습니다…) 

왼쪽부터 예진님, 수현님, 성원님


Q. 종합적인 시각에서 데이터 분석 결과를 내려면 데이터 바깥의 이슈들도 많이 알고 계셔야 할 것 같아요.


수현: 맞아요. 그래서 비즈니스에서 발생하는 이슈가 100% 시시각각 공유되지는 않는다는 점도 또 다른 어려움이에요. 분석을 하다 보면 단순히 데이터만 가지고 판단을 하는데 한계가 있어요. 예를 들어, 기능 배포와 마케팅 활동이 동시에 진행됐는데, 제가 마케팅 이슈를 모르고 있으면 잘못된 분석 결과가 나갈 수 있잖아요. 그래서 이런 외부 이슈들을 잘 캐치하고 있어야 하는데, 모든 팀에서 시시각각 공유 받기는 현실적으로 어렵기 때문에 최대한 관심을 많이 갖고, 질문을 던지고, 받은 답변에 대해 문서화를 시키려고 노력하고 있어요.


Q. 예진님은 화물 서비스를 다루시면서 겪는 어려움이 있을까요?


예진: 위에서도 살짝 언급했듯이 화물 쪽은 산업의 특성이 워낙 강해요. 수작업으로 진행하던 업무가 많아서 이를 자동화하고 AI를 도입하는게 쉽지 않죠. 하지만 필요성에 대해서는 모두가 공감하고 있어서 티맵과 자회사인 YLP 모두 함께 노력 중입니다.


Q. 반대로 정말 성취감을 느꼈던 경험도 있을 것 같아요. 어떨 때 가장 뿌듯하세요?


세희: 존재하지 않는 새로운 프로덕트를 만들어서 새로 오픈할 때 제일 뿌듯하죠. 그 서비스가 죽지 않고 잘 서비스되면 더 뿌듯하고요. 최근에는 화물 단가 API 새로 만들었을 때 가장 성취감을 느꼈던거 같아요. 그리고 새로운 기술 같은 것들 처음 사용해 봤을 때도 재밌고요.


예진: 아무래도 지표 개선이겠죠? TMAP 화물에서 신규 기능을 만들어 가는 과정이 즐겁고, 정형화되지 않은 데이터를 처리하고 분석하고 활용하는 것도 재밌습니다. 

데이터 엔지니어 겸 서버 개발자 세희님


Q. 추가로 올해 계획중인 다른 프로젝트도 있을까요? 


성원: TMAP 대리에서는 AI 보너스콜 자동화 프로젝트를 진행중이에요. 보너스콜은 승객과 기사님이 원하는 요금이 서로 달라서 콜이 매칭이 안될 때, 이 콜을 수행하시는 기사님에게 일정 금액을 더 지급해드리는 건데요. 플랫폼의 수익성을 일부 희생하더라도 최대한 매칭을 높이기 위한 방식이고, 바로 여기에 AI를 도입하고 있어요. 어떤 콜에서 승객/기사의 니즈 차이가 발생하는지 더 잘 선별하고, 어느 정도로 플랫폼이 희생했을 때 승객과 기사님의 매칭률이 높아지는지 효율화 하고자 합니다.


수현: 그리고 TMAP 대리에 적용되는 ‘다이나믹 프라이싱* 모델’도 서울 이외 지역으로 확대될 거예요. (*다이나믹 프라이싱: 수요와 공급, 시간, 날씨 등의 요소를 고려해서 기사와 고객 양쪽이 모두 만족할만한 적정 가격을 산출하는 모델)


예진: 화물은 계약 화주 단가일 것 같아요. 계약 여부에 따라 일반 화주와 계약 화주가 나뉘는데요. 계약 화주는 사전에 오더양과 오더 금액에 대해 장기 계약을 하고 안정적으로 화물 서비스를 제공받는 화주예요. 사실 1년간의 오더양과 오더 금액을 산정하는 게 쉽지 않아서 영업팀이 굉장히 고생한다고 들었어요. 한 사람이 처리해야 하는 계약 건수가 늘어서 더 쉽지 않고요. 이런 사업 요구사항을 듣고 개발한 계약 화주 단가 모델이 배포 예정입니다.


분석, 모델링, 개발이 한 팀이기 때문에
빠르게 서비스나 기능을 만들 수 있어요.


Q. 이전 회사들과 비교했을 때 티모비에서 일하는 방식에 있어 가장 큰 차이점은 무엇인가요? 


예진: 저는 이전에 보수적인 조직에 있었는데요. 그래서 처음 슬랙 썼을 때가 완전 신세계였어요. 이전 회사는 메일로 모든 업무를 진행하고, 모든 결정에 의사결정자의 컨펌과 품의 절차가 꼭 필요했거든요. 그런데 여기에서는 슬랙에서 담당자 멘션걸고 직접 질문하고, 스레드에서 자유롭게 의견 나누고, 결정까지 단시간에 되더라고요.

데이터 사이언티스트 예진님


Q. 우리팀만의 강점은 뭐라고 생각하세요? 


세희: 분석, 모델링, 개발이 한 팀이기 때문에 빠르게 서비스나 기능을 만들 수 있어요. 다른 회사는 조직 구성에 따라서 엔지니어 따로, 분석가 따로, 모델러 따로 나눠지는 경우도 많거든요. 저희는 구조가 파편화되어 있지 않아서 빠르게 의사소통한 뒤 빠르게 새로운 시도를 해볼 수 있어요. 


수현: 맞아요. 저도 이전에 분석가들끼리만 팀이 따로 있어서 아무래도 조금 한정적으로 업무를 하게 되는 경향이 있었거든요. 그런데 여기는 개발과 모델러 분들도 같이 있으니까 데이터가 들어오는 것부터 서비스에 나가는 것까지 전 과정을 가까이서 볼 수 있어서 제가 기여할 수 있는 부분도 더 잘 보이더라고요. 무엇보다 여러 분야 전문가들이 원팀으로 움직이니까 해결책도 더 다양한 시각에서 나오고요. 그리고 다들 츤데레 같은 면이 있어서 누군가 도움을 요청하면 각자 여러가지 방안을 고심해서 알려주세요. 


Q. 티맵모빌리티에서 가장 만족스러운 복지는? 

세희: 저는 의료비 지원이요. 가족들까지 다 받을 수 있잖아요. 저는 부모님과 장인 장모님까지 다 혜택을 받을 수 있어서 아주 만족하고 있습니다. 


수현: 일단 통신요금이 지원되니까 데이터 빵빵하게 쓸 수 있어서 좋고요. 복지포인트도 자유롭게 쓸 수 있어서 신혼여행 가서 꽤 비싼 호텔을 플렉스 했던 경험이 있어요.


성원: 재택이 기본 근무 형태라는게 정말 좋아요. 


수현: 저도 재택근무 덕분에 효율이 엄청 올랐어요. 저는 경기도민이어서 출퇴근하려면 최소 1시간 반은 잡아야 하는데 그럼 왕복 3시간이거든요. 거기에 화장하고 옷 골라 입고 준비하는 시간까지 합치면 4시간이에요. 재택을 하면 이 시간에 아침 요가도 하고, 과일도 챙겨 먹고, 책도 보면서 여유로운 아침을 맞이할 수 있어서 업무 효율에도 영향을 미치더라고요. 그리고 원격회의를 하면 오프라인보다 훨씬 더 핵심만 간결하게 진행되는 부분도 있는 것 같아요. 


예진: 저는 업무 특성 상 논문이나 참고 자료를 읽을 때가 많거든요. 그런데 회사 형광등 아래서 패드나 출력물로 논문을 보기가 힘들 때가 있어요. 집에서는 스탠드 켜 놓고 조용한 환경에서 최대의 집중력을 발휘할 수 있거든요. 그럴 때 재택근무가 효율이 많이 올라가죠.


세희: 가족들 돌볼 시간도 많아져요. 아이들 아침에 학교 갈 준비시켜주고 등원 시켜주고 바로 업무할 수도 있고, 운동하고 충분히 쉰 다음에 좋은 컨디션으로 일할 수도 있고요. 

Data Intelligence 팀

고객이 남기는 데이터에 TMAP이 가야 할 방향이 있다고 생각해요.


Q. DI팀에서 이뤄내고 싶은 최종 목표가 있다면? 또는 꼭 해보고 싶은 일이 있다면?


예진: 유저들에게 선택 받을 수 있는 답안을 제시하고 싶어요. 고객이 남기는 데이터에는 TMAP과 서비스가 가야 할 방향이 있다고 생각해요. 고객이 무엇을 원하는지, 취약점은 무엇인지 먼저 찾고 티맵만의 강점을 만드는 것이 목표입니다.


Q. 마지막으로, DI팀의 TMOBI WAY는 무엇인가요?


성원: 팀원들의 의견을 모았는데요. 첫째는, 고객이 만들어낸 데이터에서 답을 찾는 일을 하기 때문에 ‘고객중심’. 둘째, 팀 내의 일하는 방식은 ‘한계없이’입니다. 개발, 분석, 모델링이 원팀이 되어 자유롭게 더 나은 방법이 무엇인지 고민하고 답을 찾기 위해 고군분투하고 있거든요!

매거진의 이전글 티맵 운전점수 만드는 사람들의 운전점수는 몇 점일까?

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari