데이터바우처 AI가공 전문기업, 디피니트
안녕하세요
혁신가를 위한 AI 프로그램 개발업체, 디피니트입니다.
오늘 소개해드릴 프로젝트 사례는 버스와 관련된 내용입니다.
출처 : UNSPLASH
우리가 자주 이용하는 버스,
갑자기 노선이 통합되거나 없어지는 경우 보신적 있으신가요?
지역에 신도시가 생긴다거나 아파트단지가 들어서면 시에서 버스 노선을 새로 추가하게 됩니다.
혹은 주거 인구가 줄어들게 되면 버스 배차 간격을 늘리기도 하며
이윤이 남지 않을 경우, 노선을 통폐합 시키기도 합니다.
이렇게 노선이 새로 추가될때 이용자를 예측할 수 있는
솔루션 개발을 디피니트에 의뢰 주셨습니다.
의뢰 업체는 서울소프트라는 기업 클라이언트였습니다.
주로 운송 관련 EPR 시스템, 생산관리시스템 등을 개발하는 IT 기업이었는데요.
여러 사업 중 버스 ERP 시스템에 저희 디피니트 AI 기술을 도입하고 싶어하셨습니다.
의뢰하신 서울소프트 담당자님께서는 새로운 노선이 추가 될때마다
해당 노선 이용자를 예측하는 예측 시스템을 자사가 개발한 ERP 제품에 도입하고 싶어하셨습니다.
이렇게 의뢰를 주신 프로젝트의 주요 키워드가 있는데요.
바로 시계열 데이터입니다.
버스 이용객 데이터처럼 시간이 지남에 따라 그 데이터가 변화하는 것을
시계열 데이터라 하는데요.
이 시계열 데이터를 가공하는 기술은 고난도의 AI 가공 능력을 요구합니다.
시계열 데이터 가공에 특화된 전문성을 보유한 디피니트 연구원들이 일하고 있기때문에
컨설팅을 진행하고 프로젝트를 진행할 수 있었습니다.
위 이미지처럼 필요한 데이터는 버스관련 빅데이터와 주변 정보 데이터를 활용,
AI가 학습할 수 있게 시계열 데이터 등을 가공하였습니다.
또한, 고객이 운용하고 있는 서울소프트의 ERP 프로그램의 데이터를 가공하였습니다.
이렇게 가공된 데이터를 AI 예측 시스템에 학습시킬 수 있게 예측 모델을 구축하였는데요.
예측 모델로 측정된 데이터를 시각적으로 보여줄 수 있는 데이터 시각화 솔루션도 개발하였습니다.
이렇게 완성된 AI 모델로 예측 테스트를 하였는데요.
• MAPE (mean absolute percentage error): 0.24
➪ 실제값과 예측값 사이의 차이를 실제값으로 나눔
➪ 오차가 실제값에서 차지하는 상대적인 비율을 산출
➪ 그리고 해당 값을 절대값으로 취한 후 평균을 구한 값
➪ 0에 가까울수록 회귀 모형의 성능이 좋다고 해석
• 버스 노선 이용객 수 예측 결과
➪ 파란색: 실제 이용자 수
➪ 주황색: 모델 예측 이용자 수
이렇게 0에 가까운 완성도 높은 예측 모델을 개발할 수 있었습니다.
클라이언트 분께서도 만족하셨으며 ERP 고도화를 성공적으로 이뤄낼 수 있었습니다.
이상 디피니트의 버스 노선 이용자 예측 솔루션 개발 사례였습니다.
감사합니다.