결론: 멈추지 않는 국가 시스템을 위해

by Yameh

사건이 드러낸 것 - 세 층위의 체계 실패

이번 대전 국가정보자원관리원 화재의 본질은 물리적 발화가 아니다. 설계된 안전망이 결정적 구간에서 작동하지 않았다는 데 있다.


각론 1에서 다룬 인프라 층위에서, 전력·배터리와 서버존의 구획이 실패했고, 리튬 화재 대응 체계가 부재했으며, 노후 장비 교체가 적체되어 있었다.

각론 2에서 다룬 운영 층위에서, 관제와 CMDB가 동일 실패영역에 배치되어 있었고, DR은 존재했지만 작동하지 않았으며, 영향도 산정과 복구 우선순위 결정이 지연됐다.

각론 3에서 다룬 거버넌스 층위에서, 등급과 RTO·RPO 목표가 법적 의무로 고정되지 않았고, BCP는 문서로만 존재했으며, 책임 구조와 예산 체계가 분절되어 있었다.


이 세 층위는 독립적으로 실패한 것이 아니다. 거버넌스가 인프라 표준을 강제하지 못했고, 인프라의 취약성이 운영의 선택지를 제한했으며, 운영의 공백이 거버넌스의 실효성을 무너뜨렸다.

연쇄 실패는 우연이 아니라, 세 층위가 하나의 체계로 작동하지 않았기 때문에 발생한 필연이었다.


"문서가 있었다"는 사실은 중요하지 않다.

"작동했는가"가 전부다. 그리고 이번에는 작동하지 않았다.


이 실패는 하루아침에 만들어진 것이 아니다. 20년 넘게 쌓인 부채다.

2000년대 초반 전자정부가 급속히 확장되던 시기, "일단 구축"이 우선이었고 "유지와 교체"는 미뤄졌다.

예산은 신규 시스템 도입에 집중됐고, 기존 인프라의 노후화는 "아직 작동하니까"라는 이유로 방치됐다.

DR과 BCP는 가이드라인으로 존재했지만 법적 의무가 아니었고, 훈련은 형식적이었으며, 교체 주기는 예산 사정에 따라 계속 연기됐다. 정권이 바뀔 때마다 우선순위가 재조정됐고, IT 예산은 "가시적 성과"를 보여주기 어렵다는 이유로 삭감 1순위였다.


20년 동안 우리는 빚을 졌다. 교체하지 않은 장비, 구축하지 않은 DR, 훈련하지 않은 BCP, 제도화하지 않은 거버넌스. 이 빚은 장부에 잡히지 않았지만, 재난 리스크라는 형태로 누적됐다.

이번 화재는 그 빚의 이자가 한꺼번에 청구된 순간이다.


필요한 것은 하나의 체계다

국가 전산망이 확보해야 할 것은 가용성이 아니라 회복 탄력성이다.

장애가 발생할 수 있다는 전제 위에, 피해를 최소화하고 목표 시간·시점 내 서비스를 재개하며, 복구 전후의 행정 공백을 법적·회계적으로 정합하게 메우는 체계를 상시 유지하는 것이다.


회복 탄력성은 세 층위가 하나로 작동할 때 비로소 실현된다.

인프라는 물리적·논리적 다중화로 단일 실패점을 제거하고, 전원·냉각·구획·소화의 다층 방어선을 구축한다. 운영은 실시간 관제와 자동 전환, CMDB 기반 의존성 관리, 정기 게임데이로 인프라의 복원력을 실전에서 증명한다.

거버넌스는 등급과 RTO·RPO를 법제화하고, 수명주기 예산으로 교체를 강제하며, 조달·계약에 다중화를 내장하고, BCP 훈련과 공시를 의무화해 인프라와 운영이 작동하도록 만든다.


이 체계의 핵심은 IT를 바라보는 관점의 전환이다.

IT는 삭감 대상 비용이 아니라, 유지·교체해야 하는 국가 자산이다. 도로와 교량이 정기 점검과 보수 예산을 받듯, 서버와 네트워크도 수명주기 기반 교체 예산을 받아야 한다. 전력 설비가 내용연한을 넘기면 위험 시설로 분류되듯, IT 장비도 교체 적체를 재난 리스크 지표로 관리해야 한다. "아직 안 터졌으니 예산을 미룬다"는 논리는, 교량이 무너지기 전까지 보수를 미루는 것과 같다.


각론 1의 인프라 투자는 자본적 지출이다. 취득하고 감가상각하며, 내용연한이 오면 교체한다.

각론 2의 운영 인력은 축적형 전문 인력이다. 순환 보직이 아니라 커리어 경로 위에서 전문성을 쌓는다.

각론 3의 거버넌스는 제도적 고정 장치다. 정권이 바뀌어도 등급·RTO·RPO 하한과 의무는 변하지 않는다. 이 세 가지가 함께 작동할 때, IT는 비로소 자산으로 관리된다.


지금 시작해야 하는 이유 - 부채 청산의 시작

실행은 단계적으로, 그러나 지체 없이 진행되어야 한다.

20년 부채를 청산하는 일은 한 번의 추경으로 끝나지 않는다. 그러나 지금 시작하지 않으면, 부채는 계속 늘어나고 다음 사고는 더 크게 온다.


필자는 다음과 같은 조치를 제안한다.


30일 이내 긴급 조치에서는 각론 1의 노후 인프라 전수조사교체 적체 산정, 각론 2의 공주 DR 실전 전환 테스트와 관제·CMDB의 물리적 분리 및 읽기 전용 DR 가동, 각론 3의 핵심 서비스 등급 지정과 임시 RTO·RPO 목표 선언을 완료해야 한다.

이것은 다음 사고를 막기 위한 최소 방어선이다.

이 단계는 새로운 투자가 아니라, 지금 당장 무너질 위험이 있는 부분을 찾아내고 임시 보강하는 과정이다.


3~6개월 내 제도 착수에서는 각론 1의 서버존과 UPS존 완전 구획 설계 착수, 리튬 전용 소화·침수 냉각 대응 체계 도입, 교체 우선순위 1순위 장비군 발주를 진행한다.

각론 2는 분기 DR 게임데이와 반기 BCP 시뮬레이션을 정례화하고, 관제·CMDB·런북의 표준 스키마를 확정한다. 각론 3은 상설 컨트롤 타워 법안 상정과 등급별 아키텍처 표준 초안, 수명주기 예산 모델 수립을 추진한다.

이 단계는 부채 청산의 본격적 시작이다.

미뤄왔던 교체를 실행하고, 없었던 제도를 만들고, 훈련되지 않았던 절차를 정례화한다.


6~24개월 구간 제도 완성에서는 각론 1의 전국 센터 구획 재설계 완료교체 캘린더 기반 다년도 예산 확정, 각론 2의 다중 리전 관제 체계 구축CMDB 자동 디스커버리 전면 적용, 각론 3의 상설 컨트롤 타워 법정화RTO·RPO 하한 법제화, 조달·계약 표준 조항 의무화를 완료한다.

이 시점에서 체계는 법과 제도로 고정되고, 정권 교체와 무관하게 작동한다. 부채 청산이 완료되고, 새로운 부채가 쌓이지 않는 구조가 만들어진다.


이 일정은 권고가 아니라 의무로 관리되어야 한다. 미준수는 예산 감액과 평가 감점으로 제재되고, 이행 여부는 분기 보고와 공시로 투명하게 공개된다. 책임과 감시는 결과가 아니라 과정에 둬야 한다.

교체 로드맵 준수율, DR 전환 실측 성공률, BCP 원복 마감 준수율, 교체 적체 축소율, RTO·RPO 달성률을 핵심 지표로 삼는다. "사고가 없었다"는 성과가 아니다. "사고가 나도 목표를 달성했다"가 성과다.


포스트모템은 비난 절차가 아니라 개선 절차다. 사실 관계를 투명하게 기록하고, 원인과 대책을 연결하며, 일정과 책임을 지정하고, 다음 점검에서 이행 여부를 검증한다. 동일 유형의 사고가 반복되는 이유는 기술 부족이 아니라 거버넌스 부재다. 포스트모템을 기록하고 묻는 것이 아니라, 제도로 전환하는 것이 목적이다.


질문은 바뀌었다 - 초당적 협력의 필요성

문화의 전환 없이는 제도도 기능하지 않는다. IT를 삭감 대상 비용이 아닌 유지·교체해야 하는 국가 자산으로 본다는 원칙을 법·예산·평가 전반에 일관되게 반영해야 한다.


예산 관점에서, IT는 프로젝트 예산이 아니라 수명주기 자산 예산이다. 서버는 5년, 네트워크 장비는 7년, UPS는 10년이라는 교체 캘린더가 예산에 선반영되고, 내용연한 초과 장비는 재난 리스크로 계량화된다. 평가 관점에서, IT는 "안 터졌으니 잘했다"가 아니라 "교체했고, 훈련했고, 전환에 성공했으니 잘했다"로 판단된다. 조직 관점에서, IT 운영은 순환 보직이 아니라 축적형 전문 커리어로 제도화되고, 핵심 역량은 내부 팀이 보유하며, 외주는 확장·보완 역할로 한정된다.


이 전환의 핵심은 메시지의 일관성이다. 국회는 IT 예산 삭감을 재난 리스크 증가로 인식해야 하고, 감사원은 미집행을 문제 삼기 전에 교체 적체를 먼저 지적해야 하며, 언론은 "예산 낭비"보다 "투자 부족"에 주목해야 한다. IT는 쓰고 버리는 소모품이 아니라, 국가가 작동하기 위해 유지해야 하는 기반 시설이다. 이 인식이 바뀌지 않으면, 법을 만들어도 예산이 삭감되고, 제도를 세워도 평가에서 배제된다.


그리고 이것은 정치적 득실을 따질 문제가 아니다. 국가 핵심 시스템이 멈추면, 여당도 야당도 없다. 주민등록이 발급되지 않고, 건강보험이 작동하지 않으며, 연금이 지급되지 않는 상황에서 정치적 책임은 모두가 진다. 이번 사고는 특정 정부의 문제가 아니다. 20년 동안 모든 정부가 미뤄온 문제다. 그리고 지금, 모든 정치권과 행정부가 함께 풀어야 할 문제다.


상설 컨트롤 타워 법제화, 등급·RTO·RPO 하한의 법령 고정, 수명주기 예산의 다년도 확정, 조달·계약 표준 조항의 의무화. 이 네 가지는 국회의 입법이 필요하다. 여당과 야당이 정쟁을 넘어 합의해야 하고, 행정부는 예산 편성과 집행에서 이를 최우선으로 반영해야 한다. 교체 로드맵은 정권이 바뀌어도 유지되어야 하고, 훈련 의무는 담당자가 바뀌어도 지켜져야 하며, 공시는 어떤 압력에도 투명하게 이뤄져야 한다.


이것은 한 정부가 할 수 있는 일이 아니다. 법을 만들고, 예산을 배정하고, 제도를 집행하고, 감시하고, 평가하는 모든 주체가 같은 방향을 봐야 한다. "다음 정부가 하겠지"라는 미루기는 더 이상 용납되지 않는다. 20년 부채를 청산하는 일은 지금 시작해야 하고, 그 책임은 모두가 나눠 져야 한다.


정권이 바뀌어도 바뀌지 않는 표준과 의무, 그리고 이를 집행할 상시 조직이 필요하다. 상설 컨트롤 타워는 정치적 아젠다가 아니라 국가 기능의 생존 장치로 법정화되어야 한다. 등급·RTO·RPO 하한은 정부 지침이 아니라 법령으로 고정되어야 한다. 수명주기 예산과 조달 다중화 조항은 매년 재논의하는 것이 아니라, 한번 정하면 자동 집행되는 구조여야 한다. 그렇지 않으면 우리는 다시 같은 이유로 멈춘다.


이 사건은 끝난 일이 아니라, 다음 사건을 막기 위한 출발점이다. 각론 1은 물리적·논리적 다중화로 인프라를 바꾸고, 각론 2는 관제·CMDB·훈련으로 운영을 바꾸며, 각론 3은 법·제도·예산으로 거버넌스를 바꾼다. 이 세 가지가 함께 작동할 때, 국가 디지털 인프라는 재난 속에서도 멈추지 않는다.


질문은 바뀌었다. "다음번에는 멈추지 않을 것인가?"가 아니라, "멈추지 않도록 오늘 무엇을 바꾸는가?"다. 그리고 답은 명확하다. 인프라를 자산으로 취급하고, 운영의 전문성으로 축적하며, 거버넌스를 법으로 고정하는 것. 정치권과 행정부가 정파를 넘어 함께 힘을 합치는 것. 20년 넘게 쌓인 부채를 청산하기 시작하는 것.


지금 시작해야 한다.

이전 04화각론 3. BCP와 거버넌스