전 세계 동시 먹통 사태를 바라보며
https://www.hankyung.com/article/2024071962881
지난 금요일(2024년 7월 19일) 무탈하진 않았지만 그래도 무난했던 한 주를 마치고 퇴근해서 쉬고 있는데, 업무 메신저방에 뉴스 하나가 올라온다.
"Breaking News, 전 세계 주요공항 마비"
아니 뭔 일이래?
마이크로 소프트 클라우드 서비스가 갑자기 먹통이 되어서 주요 항공사 비행이 이륙이 지연되고 MS 서비스에 의존하던 세계 각국의 은행 병원 상점 방송국 등의 운영이 중지되는 전대미문의 사태가 벌어진 것. 순간 2022년 10월 발생했던 한국인의 통신채널 카카오톡 먹통사태가 오버랩이 되었다. 전 세계판 카카오톡 사태라 부른다면 너무 큰 비약이려나. 암튼 내 느낌은 비슷했다.
https://brunch.co.kr/@ragony/163
마침 이 날 파키스탄으로 입국해야 하는 동료직원이 있었던 터라 긴급히 왓츠앱으로 상황을 타진해 보니 출발지였던 방콕 수완나품 공항에선 별 일이 없다고 했다. 이상이 있던 항공사는 MS 서비스를 공통으로 사용하는 저가항공사에 집중되어 있었던 것.
https://www.yna.co.kr/view/AKR20240720020600009?input=1195m
워낙에 여파가 컸던 사건인지라 사고소식 초기부터 테러단체의 고의적 사이버 공격이나 바이러스 공격이 아닐까 하는 추측이 난무했지만, MS 측에서는 보안 패치를 업데이트하는 과정에서 발생한 문제라고 밝히며 음모론은 조금 사그라드는 분위기다. 진실 여부와는 무관하게, 진짜 사이버공격이라 할지언정 정부가 이를 은폐할 가능성도 크다고 생각한다. 실제 사이버공격으로 이런 일이 가능하다고 인정해 버리면 사회적 불안이 더더 커질 테니까.
글로벌 클라우드 서비스는 전 세계에서 아마존(AWS), 마이크로소프트, 구글이 거의 70%를 나눠먹는 과점 시장이다. 초대형 클라우드 서비스 회사에서 동시다발 문제가 생기기라도 하면 해당 클라우드를 사용하는 정부, 공공기관 또는 기업의 서비스가 모두 일시에 먹통이 될 수밖에 없다는 소리.
원래 인터넷은 전쟁 중 적군 공격에 의해 네트워크가 부분 손상되더라도 전체 정보관리 및 통신에는 지장이 없도록 구축한 군용 전산망인 아르파넷을 기초로 만든 거라는데, 인터넷상에서 서비스를 구현하는 상업용 툴들은 대형 클라우드 베이스로 구현되다 보니 대형 클라우드만 죽어버리면 유관 서비스도 동시에 뻗어버리는 일이 현실이 되고 말았다.
더더구나 이번 일은 (정부와 MS의 말을 100% 믿는다고 해도) 보안 소프트웨어 패치를 잘못 적용한 명백한 인재인 건데 다음번에 이른 일이 또 일어나지 말라는 법이 없다. 그리고 다음번 셧다운 사태는 고의 바이러스가 유입될 수도 있고 서버실에서 화재가 날 수도 있고 언제 어떤 이유로 발생할지 누구도 예측할 수 없는 일이다.
클라우드 서비스가 저렇게 글로벌 대형 업체에만 집중되는 일은, 군소업체가 접근하기에 기술과 비용적 측면에서 가성비가 안 나오기 때문일 것이다. 당신같으면 같은 가격에 듣보잡 군소업체에 당신의 소중한 데이터와 기업 프로그램을 맡길 것인가, 아니면 세계적 명망이 높은 기업에 맡길 것인가. 시간이 가면 갈수록 점점 더 많은 업체 또는 개인들이 클라우드 서비스에 의존하게 될 텐데 암만 생각해도 대기업 집중 과점 현상을 개선하기 쉽지 않아 보인다.
가만 생각해 보면 앞으로가 더 걱정이다.
미래 비즈니스 환경은 초거대 AI에 연결되는 사회가 될 확률이 아주아주 높다. 그러면 현재 자체 서버에 의존하는 기업들도 초거대 AI와 연결할 수밖에 없을 테고 진정 초연결 사회가 될 것이다. 그런데... 그런 시스템에서 연결된 초거대 AI가 갑자기 뻗어버린다면? 사회 전 영역에서의 셧다운을 피할 수 없을 것이다. AI에 과도하게 의존하다가 갑자기 멈춰버린 세상 때문에 문명사회가 갑자기 쇠퇴해 버리는 상상이 마냥 SF만은 아닐 것 같다.
거대 시스템은 한 번 뻗어버리면 재가동시키기가 힘들다. 백열전구마냥 스위치만 On 시킨다고 다시 가동되는 게 아니다. 이번에 문제가 된 MS 클라우드 시스템도 복구에 시간이 오래 걸리는 이유는 망가진 서버를 하나하나 수작업으로 살려가야 하기 때문이라고 했다. 거대 전력망 역시 국가단위의 블랙아웃이 발생하게 되면 완전 복구되는 시간을 최소 열흘 이상으로 잡는다. 무너지는 건 한 순간이지만, 다시 되살리는 건 공급과 소비, 주파수의 균형을 살피며 외줄타기 하는 것과 비슷하기 때문이다. 세계 단일망으로 연결된 초거대 AI가 한 번 퍼져버리면 다시 일으켜 세우지 못할 수도 있다는 말이다. 짧은 지식으로 초거대 AI의 복구 과정을 한 번 상상해 보자. 모종의 사유로 초거대 AI가 퍼졌다. 원인을 파악하고 문제를 해결한 후 다시 초거대 AI의 재기동을 하려고 한다. 그런데, 원인을 파악하고 문제를 해결하는 동안 초거대 AI가 해결해줘야 했을 수많은 문제들이 기다리고 있다. AI의 가동을 시작하는 순간, 노드에 연결된 수많은 요청들이 한꺼번에 들이닥칠 거다. 이는 마치 AI 입장에선 DDos 공격(일부러 과도한 요청을 발생시켜 서버를 뻗게 하는 해킹공격)처럼 여겨질 것이다. 과부하를 못 견딘 AI는 다시 뻗어버리고 이 과정을 다시 반복한다.
IT 전문가들도 저런 기초적인 시나리오에 대비하지 않지는 않을 것이다. 그리고 현재에도 DDos 공격이 오더라도 서버를 살리는 알고리즘과 방화벽들도 많이 나와 있으니 실제 저렇게 될 가능성은 거의 없지만, 그렇다고 할지라도 그게 뻗어버린 AI를 다시 스위치만 On 한다고 세상 시스템이 바로 정상으로 될 거라는 소리는 아니다. 거대 규모 시스템을 재가동하는 일은 생각보다 복잡하고 힘들고 시간이 필요한 일이다.
바나나의 멸종이 머지않았다는 우려의 목소리가 있다.
https://www.joongang.co.kr/article/22793915
우리가 먹는 바나나는 단 한 종류. 캐번디시 종 뿐이다.
전 세계 바나나 나무가 모두 유전자가 똑같다는 소리. 다른 바나나 종류는 캐번디시와의 경쟁에 밀려 이미 도태되어 버렸다.
문제가 없을 땐 괜찮다. 문제는 전염병이 돌면 모든 개체가 일순간에 사그라들 수도 있다는 우려다.
생태계는 종의 다양성이 많을수록 건강하다. 종이 단순하면 일순간 번성했다가 일순간 멸종하는 사례가 잦다. 경제계에서 독과점을 막으려는 이유도 비슷하다. 독과점이 생기면 생산과 가격을 한 곳에서 독점하며 서비스의 질이 점점 떨어지다가 임계점을 넘으면 결국 망해버리고 국가 경제에 심각한 영향을 끼친다. 그래서 정부는 시장에서 경쟁이 될 수 있도록 늘 장려하며 독점기업에게는 인위적인 페널티를 가한다.
그런데 미래 사회는 점점 더 독과점 기업에 의존할 수밖에 없을 것 같다.
특정 기업의 힘이 너무 커져서 결국 기업이 국가를 지배하는 레지던트 이블 영화의 엄브렐러 사가 현실에 나올 시기가 머지않았다(구글, MS 등이 이미 그런 기업일 수도 있다).
기술의 발전이 늘 인류에게 옳은 방향으로 진화한 것은 아니다.
이번 MS 클라우드 셧다운 사태를 바라보며 이런저런 생각을 해 보니, 저런 류의 사고는 필연적으로 다시 발생할 것이며 이다음 사고는 더더욱 심각한 사고가 될 것 같다는 합리적인 생각을 해 본다. 초거대 AI 초연결 세상에서 갑자기 셧다운이 온다면. 전기 공급 중단, GPS 먹통, 인터넷 먹통, 수도 먹통, 방송 먹통, 은행 잔고 확인불가, 주식 시장 붕괴, 전기가 없으니 가상화폐도 무쓸모, 자율주행차 이동 중 제어불가로 여기저기서 사고, 날아가던 비행기 추락... 사고 복구가 몇 시간만 지연되어도 물 공급 음식 공급이 불가해져 버린 대도시는 당장에 좀비도시가 되어버릴 것이다.
너무 많이 나갔나.
동시 다발 전 세계 먹통현상이 가짜 뉴스가 아니라서... 이런저런 생각과 상상을 해 보며 미래 걱정을 좀 해 보았다. 세상엔 똑똑한 사람들 많으니까 누군가는 이런 사태를 방지할 해결책을 구상하고 준비해 놓겠지.
나도 일어나지도 않은 일 너무 걱정하지 말고 편하게 잠이나 자야겠다.