brunch

[뉴-썰] 두 창업자의 다른 길- 네이버와 카카오

화재는 예상치 못한 재난일까

by 박 스테파노

https://n.news.naver.com/article/052/0001801658?sid=101


[양현서 / 카카오 부사장 : 화재라는 것은 워낙 예상할 수 없는, 그런 사고였기 때문에 그런 부분에 대해서까지는, 화재가 나서 서버 전체가 내려가는 부분까지는 대비가 부족했던 게 아닌가….]


카카오 사태가 생각보다 길게 가고 있습니다. 화재라는 재난에 대한 대응은 물론 복구라는 대책마저 더딘 모습에 IT컨설팅계에 오랜 시간 종사한 사람으로서 한탄이 나올 지경입니다. 비용적 관점에서 x86 서버를 수십 만대라는 물량으로 서비스하고 있음이 드러났고, 복구도 스탠바이 미러링이 아니라 신규 하드웨어를 세팅하는 원시적 방법으로 진행하고 있다는 것에 할 말을 잃었습니다.


더더욱 기가 찬 일은 대책 회의에서 일종의 변명을 하는 카카오의 최고 경영자들의 말입니다. '화재'는 예상할 수 없는 외변 위협이라는 말... 진짜일까요? 언뜻 일반의 일상에서 보면 '화재'는 희박한 상황임에 틀림없습니다. 그러나 IT라고 하는 정보통신기술의 영역에서는 그렇지 않다는 것이 일반적인 견해입니다.


지진, 태풍, 홍수, 화재 등의 자연재해 테러로 인한 폭파, 전쟁, 해킹, 통신장애, 전력공급 차단 등 외부요인에 의한 재해 시스템 결함, 기계적 오류, 관리정책 오류, 사용자 실수 같은 내부적 요인에 의한 장애 등 다양한 사례를 포함한다.

데이터센터 화재는 이번이 처음이 아니다. 2014년 4월 과천에 있던 삼성 SDS에서 화재가 발생, 삼성카드 등 주요 서비스가 중단됐다.

해외서도 데이터센터 화재는 종종 발생한다. 미국에서 지난 8월 아이오와주에 있는 구글의 데이터센터에서 화재가 발생했다. 이 사고로 구글 검색 서비스가 제대로 이뤄지지 않았다.

2021년 3월엔 프랑스 스트라스부르 OVH 데이터센터에서 화재가 발생했다. 이후 해당 데이터센터 고객 140여 곳이 소송을 진행 중이다.

미국에서 데이터 복구 중요성을 가장 크게 일깨운 사건은 2001년 9월 11일 발생한 테러다. 9.11 테러 이후 미국 주요 기관과 기업은 IT 재해복구에 관심을 갖기 시작하며 대책을 마련했다.

한국에서는 2018년 11월 KT 아현 국사 화재 사건으로 IT 재해복구 목소리가 높았다. IT 인프라 재해는 계속 반복되고 신속한 서비스 복원은 여전히 이뤄지지 않고 있다.

-더밀크 기사 중: 아래 링크 첨부-


데이터센터의 운영에서 '재해'에 대한 대비와 재해를 맞이 한 후 '복구'라는 대응은 일상다반사가 된 지 오래입니다. 그렇다면 카카오 경영진은 이런 '재해복구'의 사례와 트렌드를 인지하지 못한 것일까요? 아닐 것입니다. 알고 있지만 '우선순위'에서 밀려 있다고 말하는 것이 중요합니다. 보통 Chief of Risk Office라는 위기 대응 임원이 존재하면 그 임원이 대책을 발표하기 마련인데, 발언의 주인공은 '대외협력담당 부사장'입니다. 즉. 대관, 대언론, 대주주의 커뮤니케이션으로 리스크를 매니지하는 '정치적' 위기 대응 조직이 있을 뿐인 것이지요.


같은 데이터센터 상면을 쓰는 네이버의 대응과 비교가 되곤 합니다. 아마 춘천에 자리 잡은 자체 데이터센터에 유용한 백업과 장애 대응 시스템을 구성해 놓았기 때문이라 생각합니다. 카카오는 안산에 땅 보러 다닌다는 소문만 무성할 뿐, '자체 데이터 센터'는 실질적으로 없으니까요. 글로벌은 어떨까요? 연초에 '메타버스'에 열을 온리던 메타의 저커버그는 뜬금없이 '데이터센터'자랑을 합니다. 소위 말하는 유니콘 중의 유니콘이 때 묵은 인프라 자랑을 합니다. 메타뿐 아니라 구글, 아마존, 그리고 넷플릭스 까지. 그들은 데이터센터 인프라 확충에 연신 힘을 쏟고 있습니다.


https://themiilk.com/articles/a89c077f1?u=15ed0645&t=af1534aab&from&fbclid=IwAR0XCRxkk1bLqehUCdUymXcNUNXyq7sQEUDLCELfrx7vhcUNbFu61mWWrXE

실리콘밸리 테크 기업은 이처럼 '인프라' 구축에 투자를 아끼지 않는다. 서비스 안정성은 기업 생존의 기본이기 때문이다. -기사 본문 중-


창업자의 다른 - 테크 드리븐, 머니 드리븐


네이버와 비교되는 카카오의 인프라 운영 실태가 여실히 드러나는 것은 아는 사람에겐 이미 예견된 일이었습니다. 검색엔진의 네이버와 게임포털의 한게임은 2000년에 합병해 NHN으로 거듭납니다. 삼성 SDS 입사동기 이해진과 김범수의 의기투합이었습니다. 겉보기에 비슷한 서울대-SDS 동문의 궁합이라고들 이야기했지만, 2007년 돌연 김범수 의장이 손을 털고 네이버에서 나옵니다. 그리고 2년 후 세상에 카카오라는 요상한 노란 것이 나옵니다.

이해진, 김범수

사실 두 창업자를 뜯어보면 비슷한 구석이 별로 없습니다. 이해진은 컴공과의 전신인 전산학과 출신의 공학박사 엔지니어였고, 김범수는 공대 속의 상대라고 일컫는 산업공학을 전공했습니다. 창업도 이해진은 야후의 검색 엔진 열풍을 보고 한국형 검색엔진 포털을 직접 개발했다면, 김범수의 비즈니스 본류는 당대 최고의 PC방이었던 '미션 넘버원'이었습니다. PC방에 필요한 개별 클라이언트 PC 모니터링 솔루션을 개발하고, 곧장 게임 시장으로 진입한 것이지요. 엔지니어와 자본주의자로서의 시작이 뚜렷했습니다.


헤어짐의 이유도 분명했습니다. 이해진이 의장이 되어 검색엔지 고도화와 그에 필요한 인프라에 투자를 집중합니다. 이에 김범수는 한게임에서 벌어들인 캐시를 인프라 같은 '비용 자산'에 투자하는 것이 마뜩지 않았으며, 이내 이해진이 'NHN 비즈니스 플랫폼'이라는 인프라 관리 자회사를 지주회사로 삼자 반발하여 지분을 정리하고 이탈한 것입니다. 이렇듯 김범수 의장에게 '인프라'라는 것은 PC방의 PC 같은 소모품 이상도 이하도 아닌 개념으로 자리 잡았을지도 모릅니다. 그러니 자체 클라우드 사업을 운운하면서도 사내 기간 애플리케이션을 아마존 AWS를 이용하고 있다는 것도 이번에 밝혀진 것이지요.


'기술'이라는 혁신의 가보를 버리고, '자본'이라는 새로운 병기가 결국 자신을 겨누게 되는 자충수가 되었을지도 모릅니다. 역사가 판단할지도 모르겠지요. 그렇다고 네이버가 엄청 훌륭하다는 이야기는 아닙니다.



혁신은 '기술' 있다. ''말고


'빅 테크'기업을 흔히 '혁신'의 유니콘이라고 이야기합니다. 그 혁신의 필수조건은 '기술'에 있습니다. 그 기술은 생각보다 고전적(classic)입니다. 그리고 정통적(orthodox)입니다. 혁신적인 비즈니스를 위해서는 애플리케이션 등의 솔루션이 있어야 하고 그 운영을 위해 하드웨어와 소프트웨어의 인프라는 꼭 있어야 합니다. 그것도 유기적으로 중단 없이 운영되는 모습으로 말이지요. 마치 인간의 몸에 장기와 뼈대가 있어야 그 사람의 말과 생각이 존재하는 것처럼 말이지요.


2018년 국정감사에서 이해진 의장에 이어 김범수 대표도 읍소를 합니다. 구글이라는 공룡과 동일 선상에서 경쟁할 수 없으니 미국의 빅 테크 기업들의 클라우드 데이터 산업의 진입을 막아 달라고 말이지요. 똥 된장 구분 안 되는 국회의원들은 여야 가릴 것 없이 이들의 하소연을 들어줍니다. 부가가치 통신망 사업자도 기간 통신사업자와 같은 수준의 시스템 이중화와 보안 강화리는 입법을 무력화시킵니다. 그 결과가 어제오늘의 대혼란인 것이지요.

구글의 데이터 센터


IT의 영역은 생각보다 복잡하지 않습니다. 그것을 주 소득원으로 하는 기업의 IT 인프라 운영은 핵심 사업입니다. 바로 네트워크, 서버, 스토리지, 소프트웨어 등 모든 IT자원을 중단 없이 서비스하는 일입니다. 모든 시스템은 장애나 재해로 인한 서비스 중단의 위협이 존재합니다. 100%의 관용은 없습니다. 그래서 회복탄력성에 준하는 '복원력(resilience)'이 매우 중요합니다. 큰 사건 사고 후에 멘붕을 딛고 일상으로 돌아오는 것이 회복탄력성이라면, 복원력은 장애와 재해로 서비스가 중단돼도 빠르게 복구할 수 있는 능력을 말합니다.


최악의 상황 발생 시 어떻게 신속히 복구할 것인가에 대해 체계적인 프로세스를 정립하고 모의 훈련을 해야 합니다. 그 이전에 여력이 있다면, 이중의 삼중의 백업 체계를 갖추어야 합니다. 글로벌 빅 테크 기업들은 세계 각국에 데이터 센터를 분산시켜 놓고 있습니다. 그리고 주기적으로 지역별, 서비스별 자원의 이산 이행 테스트를 진행합니다. 그리고 진짜 중요한 인프라는 예비의 쌍둥이 시스템을 마련하여 백업에 대비합니다. A라는 시스템을 거의 실시간 복제하여 예비의 똑같은 A 다시 시스템을 만들아 유사시에 트래픽만 경로를 바꾸어 주는 것이지요. 마치 뮤지컬 주인공의 '언더 스터디'와 같은 개념입니다. 은행들의 시스템이 이와 같습니다.


우선 빠른 복구를 바랍니다. 그러고 나서, 미비한 점을 사회가 거들어 보완하기를 바랍니다. 거죽만 따라 하지 말고 세계 유수의 빅 테크들의 본질을 따라 해 가기라도 했으면 합니다. 대한민국의 현주소는 이런 것입니다. 선진국인 척하는 껍데기 투성의 나라. 껍데기는 가라.





keyword