데이터의 기반 위에:
네메시스의 플랫폼 구축기

by Yameh

작은 성공 이후의 깨달음

AI 도입 2년차에 접어든 네메시스에는 중요한 문화적 변화가 일어나고 있었습니다.

앞서 AICoE와 일부 현업 부서가 8주간의 사투를 벌였던 '데이터 정비'의 중요성을 이제는 전사적으로 공감하기 시작한 것입니다.

A-7 모듈 프로젝트의 성공을 지켜본 각 본부의 반응은 놀라웠습니다.

"우리도 AI를 제대로 활용하려면, 먼저 우리 데이터부터 깨끗하게 정비해야 한다"

누가 시키지도 않았는데, 생산, 영업, SCM 등 각 본부는 자발적으로 '데이터 정비 TF'를 구성하여 자신들의 영역에 쌓여있던 '데이터 부채'를 청산하기 시작했습니다.


1. 자발적 움직임: 전사로 퍼지는 데이터 문화

생산본부의 결단

생산본부는 가장 먼저 움직였습니다. A-7 모듈의 성공을 가장 가까이서 지켜본 곳이었기 때문입니다.

"설비 로그 표준을 만들겠습니다."

15년간 각 라인별로 제각각이던 설비 로그 형식을 통일하는 작업이 시작되었습니다.

'온도'라는 하나의 센서 값도 어떤 라인은 섭씨로, 어떤 라인은 화씨로, 또 어떤 라인은 '고온/중온/저온'이라는 텍스트로 기록하고 있었습니다.

2개월간의 정비 작업 끝에, 네메시스의 모든 생산 라인은 동일한 표준으로 데이터를 기록하기 시작했습니다.


영업본부의 용기

영업본부의 도전은 더 대담했습니다.

CRM 시스템에는 20년간 쌓인 고객 데이터가 있었지만, 문제는 중복과 불일치였습니다.

같은 고객이 'Samsung Electronics', '삼성전자', 'SEC', 'Samsung Elec.' 등 다양한 이름으로 등록되어 있었고, 담당 영업사원이 바뀔 때마다 새로운 레코드가 생성되곤 했습니다.

영업본부장은 고민 끝에 2주간의 영업 활동 일시 중단이라는 파격적인 결정을 내렸습니다.

모든 영업사원이 CRM 정비에 투입되었고, 15만 건의 고객 레코드를 5만 건의 깨끗한 데이터로 통합했습니다.

"2주를 잃었지만, 앞으로 수년간 쓸 수 있는 자산을 얻었습니다."


SCM팀의 집요함

SCM 팀은 가장 골치 아픈 문제와 씨름했습니다. 바로 부품 코드 표준화였습니다.

협력사마다 같은 부품을 다른 코드로 부르고 있었고, 심지어 같은 협력사도 시기에 따라 다른 코드를 사용하고 있었습니다. M8 볼트 하나도 'M8-B-100', 'BOLT_M8_100', '볼트M8/100mm' 등 수십 가지 방식으로 표현되어 있었습니다.

SCM 팀장은 6개월 프로젝트를 선언했습니다.

주요 협력사들과 일일이 미팅을 진행하며 부품 코드 표준을 협의했고, 과거 데이터를 새로운 표준으로 매핑하는 작업을 진행했습니다.


2. CIO의 결단: 움직임을 시스템으로

송주환 CIO는 이 자발적인 움직임을 놓치지 않았습니다.

"이 흐름을 일회성 이벤트로 끝내서는 안 됩니다. 지속 가능한 시스템으로 만들어야 합니다."

그는 이 흐름을 '전사 데이터 플랫폼 구축 및 고도화'라는 공식적인 프로젝트로 격상시켰습니다.

이제 네메시스의 모든 AI 이니셔티브는 이 통합 데이터 플랫폼 위에서 체계적으로 진행될 것이었습니다.


3. 데이터 플랫폼의 실체: 살아 움직이는 거버넌스

하지만 송주환 CIO가 구상한 플랫폼은 단순히 데이터를 모아두는 창고가 아니었습니다.

7장에서 데이터 문제로 고생했던 AICoE는 뼈저리게 느끼고 있었습니다.

"기술만으로는 데이터 문제를 해결할 수 없습니다."

AICoE는 이 경험을 바탕으로, 전사 데이터 거버넌스 체계 수립을 송주환 CIO에게 강력하게 제안했습니다.

기술, 프로세스, 사람이 함께 움직이는 '살아있는 거버넌스'만이 데이터의 신뢰성을 보장할 수 있다는 것이었습니다.

송 CIO는 이를 즉시 수용했고, AICoE의 주도 하에 '전사 데이터 거버넌스 협의체'가 신설되었습니다.


거버넌스 협의체의 구성

이 협의체는 다음과 같이 구성되었습니다:

- IT 부서: 기술 인프라 관리

- AICoE: 데이터 품질 기준 수립 및 모니터링

- 각 본부 '데이터 정비 TF' 리더들: 현업의 목소리 대변


협의체는 플랫폼의 '교통경찰' 역할을 수행했습니다.

AICoE는 이 협의체를 통해 다음과 같은 핵심 과제를 추진하며 데이터 거버넌스를 실질적으로 작동시켰습니다.


1) 전사 데이터 표준 및 오너십 정의

가장 먼저, AICoE는 협의체를 통해 '고객 마스터 데이터', '제품 마스터 데이터' 등 핵심 데이터의 전사 표준을 정의했습니다.

그리고 가장 중요한 변화로, 각 데이터의 '데이터 오너(Data Owner)'를 현업 부서의 책임자로 명확히 지정했습니다.


그래서 네메시스는 다음과 같이 대표적인 데이터의 오너를 정의했습니다.

- 고객 데이터 오너: 영업본부장

- 제품 데이터 오너: 생산본부장

- 부품 데이터 오너: SCM 팀장


이제 데이터 품질은 더 이상 IT 부서만의 책임이 아닌, 데이터를 생산하고 사용하는 현업의 명확한 책임이 되었습니다.


2) 데이터 카탈로그 구축 및 활성화

AICoE는 MSP와 협력하여 전사의 모든 데이터 자산을 한눈에 볼 수 있는 '데이터 카탈로그'를 구축했습니다.

사용자는 이 카탈로그를 통해 쉽게 정보를 찾을 수 있게 되었습니다:

"A-7 모듈의 일별 생산량 데이터는 어디에 있고, 누가 담당자이며, 데이터 품질은 어느 수준인가?"

검색 한 번이면 모든 정보가 나왔습니다. 이는 데이터 투명성을 높여 신뢰의 기반을 마련했습니다.


[기술 노트] 데이터 카탈로그란?

데이터 카탈로그는 기업 내 모든 데이터의 '메타데이터(데이터에 대한 데이터)'를 관리하는 중앙 집중식 시스템입니다.

마치 도서관의 목록 시스템처럼, 데이터의 위치, 구조, 오너, 이력, 품질 정보 등을 담고 있어, 사용자들이 원하는 데이터를 쉽게 찾고, 이해하며, 신뢰하고 사용할 수 있도록 돕는 '데이터의 도서관'입니다.


3) 데이터 품질 스코어카드 도입 및 정기 리뷰

거버넌스를 살아 움직이게 만든 결정적인 활동이었습니다.

AICoE는 데이터의 '완전성, 유일성, 정확성' 등을 측정하는 '데이터 품질 스코어카드'를 개발했습니다.

'데이터 거버넌스 협의체'는 매월 이 스코어카드를 함께 리뷰했습니다.


8월 협의체 회의록 중 발췌:

"이번 달 SCM 팀의 부품 코드 정확도는 98%로 목표를 달성했습니다. 훌륭합니다. 하지만 영업팀의 잠재 고객 연락처 완전성은 85%로 개선이 필요합니다. 영업본부장님, 어떻게 개선하시겠습니까?"


이는 데이터 품질을 지속적으로 관리하고 개선하는 강력한 문화적 장치가 되었습니다.


4. 기술 아키텍처: 거버넌스 위에서 작동하는 시스템

이러한 거버넌스 위에서, 기술 아키텍처는 효율적으로 작동했습니다.

MSP는 현대적인 데이터 전략의 핵심인 '데이터 레이크(Data Lake)' 아키텍처를 제안했습니다.


[기술 노트] 데이터 레이크란?

데이터 레이크는 정형(DB, Excel), 반정형(Log), 비정형(이미지, 문서) 등 모든 유형의 데이터를 원래의 원시 형태 그대로 한 곳에 저장하는 중앙 리포지토리입니다.

마치 큰 호수에 모든 데이터를 먼저 모아두고, 나중에 AI 모델 개발 등 특정 목적이 생겼을 때 필요한 데이터를 꺼내어 가공해서 사용하는 방식입니다.

이는 데이터 활용의 유연성과 확장성을 극대화하는 최신 접근 방식입니다.

AWS S3나 Azure Data Lake Storage가 대표적인 데이터 레이크 구축 기술입니다.


데이터 흐름

네메시스의 데이터 플랫폼은 이 데이터 레이크를 중심으로 구축되었습니다:

정형 데이터 (ERP 시스템)
→ 매일 밤 배치(Batch) 방식으로 데이터 레이크에 적재

비정형 데이터 (공장 설비 센서, 웹사이트 로그)
→ 실시간 스트리밍 방식으로 데이터 레이크에 적재


모든 데이터는 데이터 레이크에 안전하게 쌓였고, 거버넌스 협의체의 감독 하에 전사 표준을 준수하며 체계적으로 관리되었습니다.


5. 생산 현장의 AI 확산: 탄탄한 기반 위의 성과

탄탄한 데이터 기반 위에서, AICoE는 생산 본부의 AI 활용을 '지속적인 개선(Continuous Improvement)' 관점에서 본격적으로 확산시키기 시작했습니다.


성공의 복제: A-7에서 전 라인으로

가장 먼저 A-7 모듈 불량 예측 모델을 다른 핵심 생산 라인으로 확산시켰습니다.

B-3, C-5 등 유사한 공정을 가진 라인에서도 AI 모델이 적용된 후:

- 평균 불량률 40% 이상 감소

- 연간 25억 원의 추가적인 폐기 비용 절감


이는 가시적인 성과로 이어졌습니다.


두 번째 과제: 예지 보전 (Predictive Maintenance)

이 성공을 바탕으로, AICoE는 다음 과제로 '핵심 설비 예지 보전'을 선정했습니다.


문제 정의

AICoE는 가장 고장이 잦았던 프레스 장비의 다운타임으로 인한 손실 비용을 분석했습니다.

그리고 이를 해결하기 위해 필요한 데이터 요구사항을 정의했습니다.


데이터 수집

MSP는 이 요구사항에 따라, 프레스 장비의 PLC(Programmable Logic Controller) 센서 데이터를 데이터 레이크로 실시간 스트리밍하는 첫 번째 데이터 파이프라인을 구축했습니다.


[기술 노트] 데이터 스트리밍 서비스

AWS의 Kinesis나 Azure의 IoT Hub는 공장 설비의 센서 데이터처럼 끊임없이 발생하는 정보를 실시간으로 클라우드로 안전하게 전송하는 '고속 데이터 컨베이어 벨트' 역할을 합니다.


AI 모델 개발

이렇게 수집된 진동, 온도, 압력 데이터를 분석하기 위해, AICoE는 MSP와 협력하여 관리형 AI 서비스를 활용했습니다.

클라우드 제공사들은 예지 보전에 특화된 관리형 서비스를 제공합니다.

기업이 직접 복잡한 ML 모델을 개발할 필요 없이, 센서 데이터만 제공하면 AI가 알아서 이상 징후를 학습하고 예측해주는 서비스입니다. 이는 'AI를 활용하는 가장 빠른 길'을 제공합니다.


성과

3개월의 테스트 기간 동안:

- 두 번의 대형 장애를 평균 10일 전에 예측 성공

- 갑작스러운 라인 중단(Downtime) 시간 80% 감소

- 연간 유지보수 비용 15% 절감


시스템의 가치를 명확히 증명했습니다.


세 번째 과제: 비전 AI를 통한 검수 라인 자동화

문제 정의

AICoE는 원자재의 미세 흠집을 식별하기 위해 고해상도 카메라 이미지 데이터가 필요하다고 정의했습니다.


데이터 수집

MSP는 생산 라인의 이미지 데이터를 데이터 레이크로 전송하는 두 번째 데이터 파이프라인을 추가로 구축했습니다.


AI 모델 개발

AICoE와 MSP의 ML 엔지니어들은 데이터 레이크에 축적된 수만 장의 이미지를 활용하여 커스텀 비전 AI 모델을 학습시켰습니다.


[기술 노트] 커스텀 비전 AI 서비스

클라우드 제공사들의 커스텀 비전 서비스는 우리 회사 제품의 불량 이미지만 업로드하면, AI가 스스로 '우리 회사 맞춤형 불량 검수 모델'을 만들어주는 서비스입니다. 코딩 없이도 고도의 비전 AI를 현장에 적용할 수 있게 해줍니다.


성과

- 기존 육안 검사 대비 검출 정확도 99.2% 달성

- 검수 속도 3배 이상 향상


6. 점진적 진화의 철학

이처럼 네메시스의 데이터 플랫폼은 처음부터 거대하게 만들어진 것이 아니었습니다.

명확한 비즈니스 문제를 해결하고, 그 성과를 숫자로 증명하는 과정에서 필요한 데이터 파이프라인을 하나씩 추가하며 점진적으로 확장되고 고도화되었습니다.

이 모든 과정은 '데이터 거버넌스 협의체'의 감독 아래 전사 표준을 준수하며 체계적으로 이루어졌습니다.


첫 번째 파이프라인: 프레스 장비 센서 데이터
두 번째 파이프라인: 생산 라인 이미지 데이터
세 번째, 네 번째, 다섯 번째...


각각의 파이프라인은 구체적인 비즈니스 가치를 증명한 후에 추가되었습니다.


다음 도전을 향하여

생산 현장에서의 연이은 성공은 AI에 대한 전사적인 신뢰를 단단히 굳혔습니다.

하지만 송주환 CIO는 여기에 만족하지 않았습니다.

그는 AI 도입 단계에서 수립한 5개년 로드맵의 2단계, 즉 '확장 및 연결' 단계로 나아가야 할 때라고 판단했습니다.

"지금까지 우리는 각 생산 라인이라는 '섬' 안에서 문제를 해결해왔습니다. 하지만 진짜 문제는 섬과 섬을 연결하는 '바다', 즉 공급망(Supply Chain)에 있습니다."

아무리 생산을 잘해도, 원자재가 제때 도착하지 않거나, 만들어진 제품이 물류 창고에 쌓여있으면 아무 소용이 없습니다.

로드맵에 따라 CRM 혁신과 R&D 효율화도 병렬적으로 준비해야 하지만, 지금 가장 큰 출혈이 발생하고 있는 곳은 바로 공급망이었습니다.

"이제 우리는 개별 라인의 최적화를 넘어, 공급망 전체를 하나의 유기체처럼 움직이게 만드는 더 큰 도전을 시작해야 합니다."

송주환 CIO의 선언과 함께, 네메시스는 새로운 차원의 도전을 준비하기 시작했습니다.



이전 17화예측을 넘어 자율로: AI 에이전트가 온다