- KT 통신 서비스 중단 사태를 보며 -
오늘 아침 뉴스를 보니, KT 통신망 단절의 원인이 결국은 Human Error로 밝혀졌다고 합니다. 통신 관련 일을 하는 사람으로서, 이 소식을 접하니, 여러 가지 생각이 오고 갑니다.
#1 사람의 실수로 발생하는 통신망 outage 빈도는 생각보다 매우 높습니다
중단없는 서비스가 가장 중요한 통신망이나 데이터센터에 있어서, 서비스 중단 원인 분석 및 예방 관련 문제는 네트워크 기술 분야의 가장 오래된 연구주제 중의 하나입니다. 그런데, 원인 분석 결과에 따르면 운용자(사람)의 실수로 인한 서비스 중단 비중이 매우 높다는 것입니다.
예를 들어 1997년도에 발표된 오래된 논문에서는 전화망의 중단 원인을 분석했는데, 놀랍게도 약 50%가 Human-error에 기인한다고 분석을 하고 있군요. 즉, 전화교환기를 설정하거나 운용하는 과정에 오퍼레이터의 조작 실수로 전화 서비스 단절이 발생하는 경우가 아주 많다는 것입니다.
(출처: Sources of Failure in the Public Switched Telephone Network, IEEE, 1997)
한편, 2010년도에 출간된 논문에서는 데이터센터의 중단 원인을 분석했는데, 18% 정도가 Human error로 발생한다고 분석을 했군요.
출처: https://www.sciencedirect.com/topics/computer-science/unplanned-downtime
제가 IP 네트워크의 가용성 이슈에 천착했었던 시절 -벌써 20여년이 훌쩍 지난 듯 합니다만-, 당시 IP 네트워크 장애 원인을 분석했었던 시스코 자료에서도 Human error를 매우 중요한 원인의 하나로 지목했었습니다.
이처럼 운용자의 조작 미숙 혹은 실수로 통신 장애 발생 가능성이 높은 것은, 그만큼 통신 시스템과 명령어 체계와 순서가 복잡하기 때문이기도 합니다.
#2 모든 것이 연결되는 초연결 사회, 네트워크 연결이 갑자기 끊어진다면 ...
초연결사회로 진입하면서, 네트워크 규모와 복잡도는 점점 더 커지고 있고, 장애 발생시 사회에 미치는 영향은 상상 이상으로 커지고 있습니다. 식상한 이야기이지만, 그야말로, 의료, 사회 안전, 중요 경제 시스템 등 국민의 생명과 국가 사회의 안위가 네트워크로 연결된 디지털 세상으로 옮겨가고 있는 중이기 때문입니다.
물론, 최근에는 가급적 사람(운용자)의 영향을 최소화하기 위한 자동화나 자율화 기술들이 많이 발전하고 있고, 통신 인프라에서도 이런 자동화 기술 적용이 지속적인 관심을 끌고 있습니다. 그럼에도 불구하고, 통신망과 같이 거대하고 복잡한 시스템의 운용에 있어서 운용자의 역할은 여전히 중요하고, Human error의 발생 가능성도 여전하여, 사실 두렵기도 합니다.
#3 알고보면 취약한 디지털 사회에 우리는 겁없이 살고 있는 중
네트워크로 모든 것이 연결되는 사회에서는 통신 인프라 자체가 가장 중요한 국가 기간 SoC입니다. 따라서, 앞으로 유사한 일이 다시 발생하지 않도록 대책이 필요합니다. 아마도 과기정통부 주관하에 네트워크 인프라의 관리 감독 강화와 통신 서비스 단절 시의 배상 조치 의무화 등을 비롯한 여러 가지 규제를 강화하는 쪽으로 대책을 강구하고 있을 것 같습니다.
그런데, 네트워크 기술 연구자 관점에서 이 문제를 보자면, 인간이기에 불가피한 조작 실수와 같은 문제를 예방할 수 있는 기술개발이 반드시 추진되어야 할 것 같군요.
기술적으로 정리해 보자면
- 네트워크 인프라가 매우 거대하고 복잡한 복잡계 시스템화 되고 있고
- 네트워크 인프라 장애 시의 경제 사회 전반에 미치는 영향이 너무나 막대하므로
- 통신인프라의 안정성을 확보할 수 있도록
- 통신 네트워크 자체를 Cyber Physical System으로 모델링하고(네트워크의 디지털 트윈화)
- CPS 를 통해 상시 모니터링 및 사전 시뮬레이션을 가능하게 하는
통신인프라를 위한 CPS 기술개발이 차제에 반드시 추진되어야 할 것 같습니다.
지난 20여년, 인터넷이 만들어낸 우리 삶의 온갖 변화에 저 역시 가까스로 적응하며 살아가고 있지만, 가끔씩은 네트워크 기술 연구자로서, ‘우리가 만든 기술들이 이 세상과 이 세상의 사람들에게 무슨 짓을 하고 있는 것이지?’ 하고 새삼스럽게 놀라기도 합니다.
약간 옆으로 새는 이야기이기는 합니다만, 온라인 세상이 제공하는 정보와 스마트한 생활상이 인간을 더 똑똑하게 하고 더 나은 선택들을 할 수 있도록 도와줄 수 있을까요? 2010년에 퓨리리서치센터가 저명한 사상가 400여명을 대상으로 이에 대한 설문조사를 실시했다고 합니다. 당시에 80 %가 넘는 응답자들이 "인터넷 사용의 확산은 2020년까지 인간의 지능은 높일 것이며, 전례없이 많은 양의 정보에 접근이 가능해진 사람들은 더 똑똑해 지고 더 나은 선택을 할 것"이라고 전망을 했다고 합니다.(출처: 생각하지 않는 사람들, 니콜라스 카). 그런데, 최근에 인터넷 상에서 일어나는 여러 부정적인 현상을 목도하며, 과연 인터넷 기술이 인류의 미래에 긍정적 기여를 하게 될 것이라는 저 기대가 실현되고 있는 것인지 회의적인 생각을 더 많이 하게 됩니다. 멀리 갈 것 없이, 저의 삶만 슬쩍 들여다보아도 온라인에 접속해 살고 있는 제 삶은 마치 예전에 해답지가 뒤어 붙어 있는 문제집을 풀듯이, 문제에 부딪히면 깊게 생각하고 길을 찾기 보다는 인터넷을 검색해서 베끼며 사는 것 아닌가 싶습니다.
그런데 이번 사태를 겪고 보니, 온라인의 핵심 중의 하나인 연결성도 그 자체로 참으로 취약하기만 합니다. 말하자면, 네트워크 기술들이 이 세상 온갖 것을 서로 연결시켜 놓았는데, 막상 인간의 작은 실수 하나에도 연결된 세상이 단칼에 뚝 끊겨 버려 미래 사회를 마비시킬 수도 있다는 생각에 이릅니다. 그러니 우리가 살고 있는 이 초연결 세상이 얼마나 취약한지, 갑자기 겁이 더럭 나는군요.
물론, 앞으로 이런 일이 또 일어나지는 않겠지요. 통신망 운용관리 매뉴얼과 관리 지침도 강화될 것이고, 만약의 사태 시에도 적어도 전면적 서비스 중단은 일어나지 않도록 여러 가지 기술적 대안들로 이중 삼중의 조치가 취해지는 기술적인 대책도 강구되고 있을 것입니다. 그리고 그 중의 하나로 통신망 CPS 같은 미래지향적 기술개발도 고려되어야 할 것 입니다.
아무튼, 초연결 디지털 세상에서 이렇게 한 바탕 난리가 난 지난 며칠 동안에도, 현실 세상의 가을은 무슨 일이 있었냐며 무심히 깊어만 가고 있습니다.