데이터로 본 표준단가 예상

구매 단가 예측 프로젝트 회고

by 구매가 체질

매년 12월, 구매팀은 보이지 않는 숫자들과 전쟁을 치릅니다. 바로 '차년도 표준단가 산출' 시즌입니다.


과거에는 엑셀을 켜두고 수천 개의 품목을 하나하나 훑으며, 직전 구매가에 물가상승률 몇 퍼센트를 일괄 적용하곤 했습니다. 하지만 시장은 그렇게 단순하지 않습니다. 어떤 품목은 원자재 파동으로 급등하고, 어떤 품목은 우리의 네고 노력으로 가격이 떨어지기도 하니까요.


올해는 조금 다른 방식을 택했습니다.


"2024년과 2025년의 ERP 데이터를 학습시켜, 2026년의 단가를 과학적으로 예측해 보자."


일주일간 진행된 Python 기반의 단가 예측 프로젝트, 그 치열했던 기록을 공유합니다.


프로젝트 타임라인: 5일간의 스프린트


이번 프로젝트는 단순히 엑셀 수식을 거는 것이 아니었습니다. 시장 데이터를 긁어오고(Crawling), 이상치를 제거하고(Cleaning), 합리적인 로직(Logic)을 세우는 개발 과정이었습니다.


Day1-2: 시장의 '눈'을 빌리다

가장 먼저 외부 시장 단가 조사 시스템(price_searcher.py)을 구축했습니다.

DuckDuckGo 검색 엔진을 연동하고, 브라우저 기반의 'Interactive Pricer' 도구를 개발했습니다. 이를 통해 내부 데이터가 없는 신규 품목에 대해서도 시장 가격의 기준점을 잡을 수 있었습니다.


Day3-4: 예측 엔진을 완성하다

predict_prices_final.py 스크립트가 완성되었습니다.

단순 평균이 아닌, 품번별 최신 단가와 평균 단가를 교차 검증하여 중복 데이터를 제거했습니다.

가장 중요한 Safety Cap(안전장치)을 적용했습니다. 예측값이 아무리 높아도 전년 대비 +30%를 넘지 않도록, 아무리 낮아도 -5% 이하로 떨어지지 않도록 설정하여 현실성을 확보했습니다.

동시에 outliers_impact_2025.xlsx를 통해 통계적 이상치를 걸러냈습니다. 튀는 데이터 하나가 전체 평균을 망치는 것을 방지하기 위함입니다.


Day5: 신뢰를 입히다

숫자만 던져주는 것은 무책임합니다. 이 예측값이 얼마나 믿을만한지 '신뢰수준(Confidence Level)' 컬럼을 추가했습니다.

데이터의 충분성, 변동폭에 따라 [높음 / 보통 / 낮음] 3단계로 분류하여, 의사결정자가 리스크를 판단할 수 있게 도왔습니다.


핵심 예측 로직: 기계는 어떻게 판단했나?


2,213개에 달하는 품목을 사람이 일일이 판단할 수는 없습니다. 그래서 아래와 같은 3가지 핵심 알고리즘을 적용했습니다.


1. 인상 품목 (24년 → 25년 가격 상승)

판단: 시장 상황에 따라 자연스럽게 오른 품목입니다.

적용: 개별 인상률을 그대로 반영합니다.

신뢰수준: 높음 (데이터의 추세가 명확함)


2. 네고 품목 (24년 → 25년 가격 하락)

판단: 구매팀의 노력으로 단가를 낮춘 케이스입니다. 하지만 내년에도 공급사가 이 가격을 유지해 줄지는 미지수입니다.

적용: 보수적으로 접근하여 표준 인상률 15%를 적용합니다. (리스크 헷징)

신뢰수준: 보통 (협상 변수 존재)


3. 신규/비교불가 품목

판단: 과거 데이터가 없거나 비교가 불가능한 경우입니다.

적용: 수집된 시장가들의 중위값(Median)을 적용합니다.

신뢰수준: 낮음 (추후 견적 확인 필요)


결과물: 숫자가 그림이 되다


단 일주일 만에 도출된 결과물은 기대보다 강력했습니다.


2026_예상단가표_v3.xlsx: 총 2,213개 품목에 대한 품번, 규격, 제조사 정보와 함께 2026년 예상 단가가 매핑되었습니다.

시각화 리포트: 2026_price_increase_boxplot.png 등 다양한 박스플롯 차트를 생성하여, 전체적인 인상률 분포와 제조사별 가격 정책을 한눈에 파악할 수 있게 되었습니다.


Gemini_Generated_Image_tkjnrbtkjnrbtkjn.png

마치며: 구매의 미래는 '예측'에 있다


이번 프로젝트의 가장 큰 수확은 단순히 '단가표'를 빨리 만든 것이 아닙니다. "왜 이 가격인가?"라는 질문에 대해 데이터와 로직으로 대답할 수 있게 되었다는 점입니다.


단순 반복 업무는 Python에게 맡기고, 구매 담당자는 그 결과값(신뢰수준 '낮음' 항목 등)을 검토하고 전략을 수립하는 데 집중하는 것. 그것이 우리가 나아가야 할 구매의 미래가 아닐까요?


2026년, 우리는 더 이상 가격 인상 통보에 놀라지 않을 것입니다. 이미 데이터로 예견하고 준비했으니까요.

keyword
작가의 이전글AI 활용법: 개떡같이 말하면 개떡같이 듣는다.