8주간의 사투:
데이터 늪에서 진주를 캐다

by Yameh

안녕하세요.

지난 화에서 네메시스는 'A-7 모듈의 미세 균열 불량 예측'이라는 첫 번째 AI 과제를 선택했습니다.

안정을 시작으로 기반을 다지고, 최종적으로 성장으로 나아가는 전략적 첫걸음이었습니다.

하지만 송주환 CIO의 고민은 여기서 끝나지 않았습니다.

목표가 정해졌다고 해서 저절로 프로젝트가 굴러가는 것은 아니었습니다.

성공을 위해서는 전략, 현업, 기술, 그리고 인프라라는 네 개의 축이 한 몸처럼 움직여야 했습니다.


네메시스 역사상 최초의 '4자 연합'

송주환은 기존에 네메시스의 클라우드 인프라(S/4HANA Cloud, Nemarket 등)를 운영하고 있던 CSP(Cloud Service Provider)와 MSP(Managed Service Provider)의 담당자들을 AI COE 사무실로 불렀습니다. 그리고 전략 파트너로 선정된 컨설팅 C사와 함께, 네메시스 역사상 최초의 '4자 연합' 킥오프 미팅을 열었습니다.

송주환은 회의를 시작하며 말했습니다.

"오늘 이 자리는 갑과 을의 관계가 아닙니다. 우리는 네메시스의 미래를 건 첫 번째 전투에 함께 나서는 '연합군'입니다. 각자의 위치에서 최고의 전문성을 발휘해주셔야 합니다."

이 4자 연합은 명확한 역할 분담을 통해 프로젝트를 준비하기 시작했습니다.


네메시스 AI COE (프로젝트 오너): 프로젝트의 최종 목표와 성공 기준(KPI)을 정의하고, 내부 현업(생산본부)과의 소통을 책임지며, 최종 의사결정을 내립니다.

컨설팅 C사 (전략 및 PMO): AI 프로젝트 6단계 표준 프로세스에 기반하여 전체 프로젝트를 관리하고, 비즈니스 요구사항과 기술적 구현 사이의 간극을 메우는 '번역가' 역할을 수행합니다.

CSP (기술 자문): 네메시스의 표준 클라우드 플랫폼을 기반으로 불량 예측 모델을 개발하는 데 필요한 기술적 가이드, 최적의 아키텍처, 그리고 성공 사례를 제공합니다. 파일럿 프로젝트를 위한 일부 크레딧(무료 사용권) 지원도 약속했습니다.

MSP (인프라 및 데이터): 기존 클라우드 운영 경험을 바탕으로, 온프레미스 MES 시스템의 생산 데이터를 클라우드 AI 플랫폼까지 안전하고 안정적으로 연결하는 데이터 파이프라인을 설계하고 구축합니다.

또한 이 과정에서 네메시스 내부 인력(김태현 등)에게 실질적인 기술 이전을 통해 내부 역량 강화를 돕습니다.


첫 번째 허들: 기술 주도권 싸움

물론, 이 '연합군'의 시작이 마냥 순탄했던 것은 아니었습니다.

첫 기술 아키텍처 회의에서부터 미묘한 신경전이 벌어졌습니다.

MSP 담당자는 기존 시스템과의 안정적인 연동을 최우선으로 강조하며 검증된 데이터 파이프라인을 주장한 반면, CSP 담당자는 자사의 최신 서버리스 AI 서비스를 도입해야 장기적으로 확장성이 높다고 맞섰습니다.

자칫 기술 주도권 싸움으로 번질 뻔한 순간, 컨설팅 C사의 김상훈 이사가 나섰습니다.


"두 분의 의견 모두 일리가 있습니다. 하지만 우리의 첫 목표는 '최고의 기술'이 아니라 '확실한 성공'입니다. 이번 파일럿에서는 MSP의 제안대로 안정성에 무게를 두되, 향후 확장성을 고려해 CSP의 신기술을 검토할 수 있는 여지를 남겨두는 것은 어떨까요?"

그의 합리적인 중재안에 양측은 고개를 끄덕였고, 4자 연합은 첫 번째 허들을 넘으며 진정한 '원팀'으로 거듭나기 시작했습니다.

이 4자 연합은 앞으로 2주간 매일 오전에 모여, 파일럿 프로젝트의 구체적인 범위, 데이터 요구사항, 기술 아키텍처, 그리고 16주간의 상세 일정을 수립하는 작업에 돌입했습니다.


첫 번째 관문: 데이터는 '레이크'가 아닌 '늪'이었다

프로젝트 2주차, MSP가 주도하여 온프레미스 MES 시스템의 데이터를 추출하는 순간, 모두가 경악했습니다.

데이터는 '레이크(Lake)'가 아닌 '늪(Swamp)'이었습니다.

센서값은 중간중간 비어 있었고, 작업자 ID는 수시로 바뀌었으며, 일부 데이터는 수기로 작성된 작업일지를 스캔한 이미지 파일 형태로 존재했습니다.

이때부터 8주간의 지루하고 고통스러운 '데이터 정제' 작업이 시작되었습니다.

4자 연합은 온프레미스 MES DB, 로그 파일 서버, 스캔된 작업일지 등 다양한 소스에서 데이터를 추출하여, 프로젝트를 위해 별도로 마련한 온프레미스 '데이터 정제용 스테이징 서버'로 모았습니다.

여기서 온갖 종류의 '데이터 빚'을 청산하는 작업이 이루어졌습니다.

정제된 데이터는 네메시스의 클라우드 플랫폼으로 이전되어, AI 모델링을 위한 파이프라인에 연결되었습니다. MSP는 온프레미스와 클라우드를 안전하게 연결하는 데이터 전송 작업을 담당했고, 데이터 아키텍트 한준호 차장과 김태현 엔지니어는 클라우드에서 데이터를 최종 처리하여 머신러닝 모델이 학습하기 좋은 형태로 변환하는 작업을 수행했습니다.


"이게 AI 프로젝트 맞습니까?"

처음에는 의욕에 넘쳤던 팀원들도 점차 지쳐갔습니다. 특히 영업팀에서 파견된 김민준 과장의 불만이 터져 나왔습니다.

"이게 AI 프로젝트 맞습니까? 하루 종일 엑셀만 들여다보면서 오타나 찾고 있는데, 차라리 영업 현장에 나가는 게 회사에 더 도움이 되겠습니다."

그의 말에 다른 팀원들도 공감하는 분위기였습니다.

그때 묵묵히 낡은 작업일지를 뒤적이던 박성진 부장이 입을 열었습니다.

"김 과장 말이 맞아. 답답하고 의미 없어 보이지." 그는 돋보기를 들어 희미한 글씨를 해독하며 말을 이었습니다. "그런데 말이야, 이 장부에 적힌 알아보기 힘든 글씨 하나하나가 다 우리 선배들이 흘린 땀이고, 이 비어 있는 데이터 하나가 우리가 놓쳐버린 돈이야. 지금 우리가 하는 건 그냥 오타 잡는 게 아니야. 우리가 수십 년 동안 아무렇게나 쌓아온 '데이터 빚'을 이제야 갚는 거라고."

박 부장의 말에 회의실은 숙연해졌습니다.

그는 이 과정을 통해 누구보다 데이터 관리의 중요성을 뼈저리게 깨닫고 있었습니다.

그의 독려 아래, 팀원들은 다시 마음을 다잡았습니다.

박 부장이 수십 년 된 작업일지와 동료들의 기억을 더듬어 암호 같던 수기 데이터의 의미를 하나씩 해석해주면, 네메시스의 데이터 아키텍트 한준호 차장이 그 의미를 분석 가능한 형태로 변환하여 스테이징 서버에 차곡차곡 쌓아나갔습니다.

현장의 경험과 IT의 기술이 결합되는 진짜 협업이 시작된 것입니다.

Pilot_Project_Data_Pipeline_Architecture_Visual.png


돌파구: 현장의 경험이 AI의 눈을 뜨게 하다

프로젝트 8주차, 첫 번째 모델의 학습 결과가 나왔습니다.

예측 정확도 48%.

처참한 수치였습니다. "AI 그거 별거 아니네"라는 냉소적인 목소리가 터져 나오기 직전이었습니다.

송주환 CIO가 팀을 소집했습니다.

"기술 플랫폼의 문제가 아닙니다. 우리가 무언가 중요한 것을 놓치고 있는 겁니다. 현장을 다시 봅시다."

컨설팅 C사의 주도로 '데이터 다시 보기' 워크샵이 열렸습니다.

AI 모델이 찾아낸 미미한 상관관계 패턴들을 띄워놓고 모두가 머리를 맞댔습니다.

"부장님, 혹시 불량이 많았던 날, 평소와 달랐던 점이 아주 사소한 것이라도 기억나는 게 있으신가요?"

컨설턴트의 질문에 박 부장은 한참을 생각에 잠겼습니다.

"글쎄... 기억이 가물가물한데... 아! 유독 비 오거나 습한 날 야간 근무 때 불량이 많았던 것 같기도 하고... 그때 단가를 맞추려고 잠시 썼던 중국산 C-1 원자재가 있었는데..."


그 순간, 회의실의 공기가 바뀌었습니다.

김태현 엔지니어가 즉시 과거 구매 시스템 기록과 기상청의 공공 데이터를 수집해 기존 생산 데이터와 결합했습니다. 새로운 변수가 추가된 데이터를 클라우드 플랫폼에 다시 입력하고 모델 재학습을 시작했습니다.

그리고 며칠 후, 결과가 나왔습니다.

정확도 97%.

AI가 찾아낸 불량의 핵심 원인(Feature Importance)은 명확했습니다.

'C-1 공급사의 원자재' + '공장 내부 습도 75% 이상' + '야간 근무조'

이 세 가지 조건이 '동시에' 충족될 때 미세 균열 불량률이 기하급수적으로 폭증한다는 패턴이었습니다.


20년 묵은 미스터리의 해답

이는 단순한 문제가 아니었습니다.

C-1 원자재는 입고 시 모든 품질 검사를 통과했지만, 고습도 환경에 노출되면 미세한 성질 변화를 일으키는 '잠재 결함(Latent Defect)'을 가지고 있었습니다.

그리고 공장 전체가 아닌, A-7 모듈 생산 라인 주변의 국소적인 환경이 문제였습니다.

비용 절감을 위해 야간에 공조 시스템 가동을 줄이면, 해당 구역의 습도가 일시적으로 75% 이상으로 치솟았던 것입니다.

결국, 잠재 결함이 있는 원자재가, 습도가 높은 특정 구역에서, 야간에 가공될 때라는 세 가지 조건이 완벽하게 맞아떨어질 때만 불량이 발생했기에, 지난 20년간 그 누구도 원인을 명확히 규명할 수 없었던 것입니다.


이것이 매월 균일한 수준의 폐기 비용이 발생했던 진짜 이유였습니다.

박성진 부장은 자신의 낡은 업무수첩을 꺼내 들었습니다.

수첩 한구석에 "습한 날 야간, 원인 불명 불량 급증"이라고 적힌 메모가 희미하게 보였습니다.

평생을 바친 현장에서 어렴풋이 느끼고 있었지만 증명할 수 없었던 직감이, 데이터와 AI를 통해 명확한 사실로 눈앞에 펼쳐진 순간이었습니다.

그는 잠시 말을 잇지 못했습니다.

송주환 CIO가 조용히 그의 어깨에 손을 얹었습니다.

"부장님의 20년 경험이 없었다면, AI는 절대 이 패턴을 찾지 못했을 겁니다."

4자 연합의 모든 멤버가 고개를 끄덕였습니다.

이들은 이제 진정한 한 팀이 되어 있었습니다.




다음 화에서는 16주간의 PI 프로젝트 최종 보고회가 열립니다. 97%의 정확도와 연 18억 원 절감이라는 성공을 발판 삼아, 네메시스는 어떤 미래를 그려낼까요? 5개년 AI 혁신 로드맵의 전모가 공개됩니다.

이전 12화AI 도입: 누구와 함께, 무엇부터 시작할 것인가