AI는 당신이 싼 똥을 치우지 않는다 (5)

인공지능의 똥을 치울 수 있는 사람만 살아남는다

by Gildong

제5화 | 임기응변으로 연명하는 시스템은 반드시 멈춘다


"어제까진 문제없었습니다. 분명히 제가 직접 돌렸을 땐 제대로 들어갔거든요."


금요일 오후 4시, 파트너사 정산을 앞둔 마케팅 본부의 항의에 담당 엔지니어는 억울함을 호소했다. 이번 정산은 외부 지급금이 걸린 민감한 작업이었다. 원인을 파헤쳐 보니 상황은 참담했다. 자동화된 오케스트레이션 도구 대신 담당자가 매일 아침 수동으로 실행하던 스크립트가 문제였다. 그날따라 급한 회의가 겹치자 담당자는 "어제와 별반 다르지 않겠지"라는 안일한 판단에 기대어 실행 과정을 건너뛰었다.


시스템은 담당자의 기억력과 임기응변이라는 가장 불확실한 변수에 의존하고 있었다. 에러 로그는 어디에도 없었고, 장애 알람은 오직 담당자의 머릿속에서만 울렸다. 시스템이 물리적으로 고장 난 것이 아니라 담당자의 관리 루틴이 무너진 순간, 데이터는 오염되기 시작했다. 첨단 AI가 쏟아지는 2026년에도 현장의 수많은 팀은 여전히 시스템이 아닌 사람의 요행에 기대어 하루를 버티며 데이터 오물을 방치한다.


바이브 기반 엔지니어링의 민낯

현장에는 체계적인 관리 시스템 없이 운영되는 팀이 여전히 많다. 크론탭(Crontab)에 의존하거나 수동 트리거, 혹은 "누군가 하겠지"라는 막연한 기대로 파이프라인을 유지한다. 업계에서는 이를 '바이브(Vibe) 기반 엔지니어링'이라 부른다. 문서화된 규칙 대신 담당자의 경험칙에 의존하고, 로그 체계가 없어 치명적인 장애가 터져야만 사태를 파악하며, 담당자가 자리를 비우면 시스템 전체가 블랙박스가 되는 구조다.


문제는 AI 도입으로 데이터의 양과 복잡도가 기하급수적으로 늘어났다는 사실이다. 과거에는 수동으로 한두 번 치울 수 있었던 오물이 이제는 AI라는 강력한 펌프를 타고 거대한 쓰나미가 되어 몰려온다. 작업 간 의존성 관리도, 실패 시 자동 재시도 로직도, 데이터 품질을 검증하는 체크포인트도 없는 조직에서 AI를 쓰는 일은 브레이크 고장 난 트럭에 터보 엔진을 다는 것과 같다. 파멸적 결함은 예견된 수순이며 단지 시점의 문제일 뿐이다.


유연한 운영은 무책임한 방치의 다른 이름이다

조직 규모가 작으니 시스템 도입보다 유연하게 대처하는 게 빠르다는 변명은 게으름의 산물이다. 시스템을 구축하는 번거로움을 '속도'라는 이름으로 포장하고 있을 뿐이다. 진짜 문제는 유연함 자체가 아니라, 확장 가능성을 고려하지 않고 재현 가능성을 확보하지 않은 임기응변에 있다.


진정한 실력은 위기 상황에서의 화려한 임기응변이 아니라, 위기 자체가 발생하지 않도록 만드는 지루한 자동화에서 나온다. 엔지니어의 컨디션이나 개인적 판단과 상관없이 데이터는 정해진 법칙에 따라 흘러야 한다. 사람이 개입해야만 돌아가는 시스템은 엔지니어링이 아니라 디지털 가내수공업에 불과하다. 자동화는 단순한 비용이 아니라 AI가 양산할 예측 불가능한 오물을 막아내는 유일한 보험이다.


무균 상태를 잃어버린 수술실

데이터 시스템 운영은 무균 상태의 수술실 관리와 같다. 오케스트레이션 시스템은 수술실의 공기 정화기이자 자동 소독 장치다. 자신의 직관을 믿고 소독 절차를 건너뛰며 "어제도 괜찮았으니 오늘도 괜찮을 것"이라 말하는 의사를 신뢰할 수 있겠는가.


오케스트레이션이 없는 팀의 데이터는 이미 병원균에 감염된 상태다. AI는 이 감염된 데이터를 먹고 자라며 결국 조직 전체에 치명적인 패혈증을 일으킨다. 귀찮아서 혹은 바빠서 무시한 작은 절차 하나가 훗날 조직의 심장을 멈추게 할 대형 장애로 돌아온다. AI는 오염된 데이터를 구원하지 않는다. 그저 오염을 더 넓고 깊게 퍼뜨릴 뿐이다.


엔지니어의 직관을 믿지 마라. 오직 기계가 보증하는 절차와 기록만을 믿어라. 임기응변으로 연명하는 시스템은 반드시 멈춘다. 그리고 당신은 머지않아 자신이 싼 똥에 파묻혀 고사할 것이다.


[오늘의 복구 프로토콜] 바이브 기반 엔지니어링 퇴출 지침

수동 작업 전수조사: 담당자가 직접 클릭하거나 기억해야 돌아가는 프로세스는 시스템이 아니라 당신이 치워야 할 오물이다.

모니터링의 기계화: 장애 발생을 사람이 발견한다면 당신의 모니터링 체계는 죽은 것이다. 시스템이 먼저 비명을 지르게 하라.

오케스트레이션 도구 강제화: Airflow든 Dagster든 무엇이라도 좋다. 작업 간 의존성과 복구 로직을 기계에 맡겨라. 인간의 판단보다 기계의 논리가 훨씬 안전하다.