brunch

You can make anything
by writing

C.S.Lewis

by 홍수상태 Jan 01. 2023

우리의 모든 데이터가 소실된다면, 대정전(블랙 아웃)

데이터센터, 그 몸집만큼 커진 위험


지난 10월 15일, 분당의 SK C&C에서 화재가 발생했어요. 안타깝게도 화재가 발생한 장소는 카카오의 데이터센터가 위치한 건물이었죠. 우리 일상생활에 깊숙이 들어와 자리잡고 있는 카카오 서비스와 일부 기능들이 중단 되어버렸어요. 이 피해가 완전히 복구되는 데 까지 걸린 시간은 127시간. 특히 복구가 더뎠던 카카오 서비스가 마비되는 동안은 온 사회도 같이 마비된 것처럼 모두가 불편을 감내해야 했어요. 이 사건을 겪고나니 머릿속에 스쳐 지나가는 영화 속 장면이 있었어요.



대정전(Black Out)


영화 <블레이드 러너>는 리들리 스콧 감독 작품으로 과학기술이 고도로 발달한 2019년을 묘사하고 있어요. 영화의 큰 줄거리는, 타이렐 사가 인간을 대신해 어려운 일을 수행할 복제인간 ‘리플리컨트’를 만들어 내는 것에서 시작해요. 리플리컨트는 인간의 욕구를 충족시키기 위해 ‘성매매’, ‘우주식민지 개척 전쟁’ 등에 소모되며, 4년이라는 짧은 수명만 누린 채 폐기처분되는 존재였죠.


이와 같은 차별과 불평등에 눈을 뜬 리플리컨트들은 결국 폭동을 일으키게 되는데. 이 리플리컨트들은 자신들이 복제인간이었다는 기록을 모두 지워버리기 위해 2022년 EMP탄을 터뜨리게 돼요. 그리고 그 결과, 온 세상은 “대정전”(블랙 아웃, Black Out)의 암흑 속에 빠지게 돼죠.


*EMP탄이란, 강력한 전자기파로 지상의 전자기기 내부 회로를 태우는 공격 무기로, 현대 문명을 순식간에 석기시대로 돌려 보낼 수 있다. (출처 : 다음백과)

▲ 영화 <블레이드 러너 2049> 중


“대정전 당시 당신은 어디 있었나요?

난 집에 있었는데 열흘간 정전됐었죠. 기계란 기계는 다 멈췄어요.

전기가 돌아왔을 때 전부 다 지워졌죠. 사진, 파일, 데이터, 은행 기록까지.


우습게도 문서는 남았어요. 우린 전부 드라이브에 저장하고 있었는데.

어머니는 아기 사진들 지워졌다고 아직도 우세요.(웃음)”


짤막한 장면이지만 세상을 바꿔 놓은 대정전의 무서움을 가늠해볼 수 있죠. 우리의 소중한 기억만큼이나, 그 기억을 저장하는 데이터센터 또한 우리가 지켜야 할 귀중한 자산이 되었어요. 그래서 데이터센터가 또다시 언제, 어떤 위험으로 중단될지 예측할 수 없어 우려스러워요. 영화 속의 EMP탄이 아니더라도 자연재해, 테러, 전력 중단 등 우리가 통제할 수 없는 위험들이 데이터센터를 위협할 수 있어요.



데이터센터, 그 몸집만큼 커진 위험

▲ 데이터센터의 정의(출처: 송준화 데이터센터에너지효율협회 사무국장)


데이터센터는 365일 무중단으로 IT서비스제공에 필요한 장비를 관리하는 시설이에요. 매일 생겨나는 엄청난 양의 데이터를 저장하고, 처리하고, 유통하며, 도래하고 있는 4차 산업혁명에 필수적인 역할로 자리매김하고 있는데요.


국내 데이터센터의 수는 2021년을 기준으로 159개이며, 약 10년 전인 2012년에는 114개를 기록한 수치와 비교하면 빠르게 증가하고 있어요. 이 중 112개는 정부에서 운영하는 비수익용센터이고 47개는 상업용 센터로 KT, SK브로드밴드, 삼성SDS, NHN·네이버 등 통신사, 포털사이트, 금융기업 등이 운영하고 있고요.


전 세계적으로 확장해보면, 전 세계 데이터센터 숫자는 2021년 1,851개를 기록했는데, 이는 5년 전과 비교하여 무려 50%가 증가한 규모예요. 


▲ 2019 국내 데이터센터의 규모 및 분포(출처 : AI·클라우드 시대 급부상한 '데이터센터', 김지선 기자, 전자신문, 2021.03.16.)


업타임(Uptime Institute)은 1999년에 설립되어 데이터 센터의 안전성, 가용성 등을 검증하는 국제 기관인데요. 매년 전세계를 대상으로 데이터센터 설문조사를 실시하며 의미있는 결과를 발표하고 있죠.  이번 2022년에도 800명의 데이터센터 소유자 및 운영자가 참여하고, 전 세계 700명의 데이터센터 공급자, 설계자, 고문의 의견이 반영된 설문조사 결과는 중요한 지표들을 담고 있어요.


업타임 조사결과에 따르면, 사실 사이트당 중단 횟수가 감소하는 추세라고 해요. 설문 참여자의 60%는 최근 3년 동안 사이트 중단을 경험했는데, 2020년에 78%, 2021년에는 69%로 개선이 되고 있죠. 또한 중단된다고 하더라도 심각한 수준의 중단 횟수도 내려가고 있어요. 그런데 여기에는 맹점이 하나 있는데, 중단 비율은 감소하나 중단 횟수는 매년 증가하고 있다는 점이에요. 데이터센터 설비 증가가 많아지다 보니 그 모수가 커지고 있기 때문이죠.


여기에서 횟수보다도 더 주목해야 하는 점은 ‘해결 비용의 증가’예요. 비용 중단으로 인한 손실비용이 약 14억 원 이상에 달하는 중단 사고가 점차 늘어나고 있어요. 실제로 구체적인 비용을 조사해보면 직간접적 비용으로 14억 원이 소요됐다는 응답이 25%였어요. 이는 전년 대비 무려 15%가 증가한 수치였죠.


비용이 커지는 이유는 무엇일까요? 물가 상승, 벌금 등의 요인들도 있지만, 데이터선터에 의존하는 기업의 경제 활동 비중이 커지고 있는 게 핵심이예요. 즉, 서버가 중단되는 비율이 줄어들지라도 한 번 중단이 되면 그로 인한 피해가 막대해지고 있다는 해석이 될 수 있죠. 데이터센터에 직면할 수 있는 위험을 예측하기 위해서는 업타임에서 조사한 결과를 주의 깊게 들여다볼 필요가 있어요. 위험은 크게 세 가지로 분류할 수 있어요. 그리고 그중 두 개의 위험은 어떤 해결 방안이 있는지 알아봤어요.


위험 1. 노후화 - 제때 은퇴하지 못하는 서버


데이터를 저장하는 서버의 수명 주기가 점차 길어지고 있어요. 서버의 수명 주기를 늘리는 기술이 발전한 것이 아니라 그만큼 서버를 수명 주기 이상으로 사용하고 있는 것인데요. 솔루션 업체에서는 서버의 적절한 수명으로 3~5년을 제시하지만, 설문조사 결과 5년 이상 운용한다는 응답자가 52%나 되었어요.


서버가 제때 은퇴하지 못하는 다양한 원인은 다양한데요. 핵심적인 원인은 반도체의 가격 상승수급의 어려움이에요. 반도체 비용 증가에 따라 업체에서는 교체나 개선(업그레이드)에 부담을 느낄 수밖에 없기 때문에 서버의 은퇴가 계속 뒤로 미뤄지고 있어요.


반도체 수급 어려움의 문제 또는 반도체 공급망 이슈라 불리는 이 현상은 꾸준히 증가하는 반도체 수요량이 생산량을 넘어섰을 때부터 발생했는데요. 코로나19 이후 언택트 기술을 뒷받침하기 위한 서버, PC 등의 전자기기 수요가 폭발적으로 증가하며 더욱 심화되고 있어요.


또한 국가 간의 외교 분쟁은 반도체 제조에 필수적인 원자재(규소, 텅스텐 등) 생산 감소로 반도체를 생산하는 시간과 비용에 영향을 끼치게 되었어요. 대표적으로 중국의 호주산 석탄 반입금지로 인해 중국 원자재 공장이 운영 중단된 일을 기억하실 거예요. 팬데믹과 국제 외교 분쟁이 데이터센터의 노후화까지 영향을 끼치고 있는 상황이죠.


위험 2. 인력난 - 데이터센터 인력의 세대교체 문제


설문에 의하면, 무려 데이터센터 운영자의 절반(53%)이 적격한 지원자를 찾기 어렵다고 응답했어요. 2021년은 47%, 2018년은 38%만이 직원을 찾기 어렵다고 응답한 숫자와 비교하면 급등하고 있는 실정인데요.


전 세계적으로 늘어나는 데이터센터의 숫자만큼이나 필요한 인력도 늘어나고 있어요. 2019년에는 풀타임 근무자의 숫자가 200만 명이었으나 5년 뒤인 2025년에는 10%가 증가한 230만 명이 필요하다는 분석이 나오고 있고요. 국내의 경우 데이터센터 고용 인원은 2019년 기준 1만 768명으로 센터당 평균 141명이 근무 중이라고 해요.


하지만 현실은 정반대로, 기존의 성숙한 데이터시장인 북미나 유럽 전문인력은 곧 은퇴를 바라보고 있는 시기에요. 2019년 설문조사에 의하면, 응답자의 45%는 20년 이상의 경력자로 이들의 은퇴로 인한 공백을 미리 예단하지 않으면 인력난 문제가 심각해질 수 있어요.


인력난의 원인 중 하나로 다양성 부족이 지목되고 있어요. 업타임 조사 결과에 따르면 인력의 연령 불균형 그리고 성비 불균형이 심각한 것으로 나타났어요. 5년 경력 미만의 신입 경력자의 비율은 5%이며, 여성인력은 6% 미만으로 나타났어요. 데이터센터 산업으로 더 많은 인력 유입을 위해서는 교육과 홍보를 통해 연령과 성비 다양성을 높이는 것도 방안이 될 수 있어요.


추가로, 국내에서는 데이터센터 지방 이전을 위한 중앙정부-지방정부 간의 사업들이 진행되고 있어요. 일례로, 2019년 과학기술정보통신부는 광주광역시에 인공지능 집적단지 조성계획을 발표하며 핵심인력 1,260명을 양성한다는 목표를 내놓았어요. 인력 양성은 지방 거점 4개 대학과 협력하여 진행된다고 하니 시간이 지나면 그 효과를 기대해 볼 수 있을 거예요.


위험 3. 전력난 - 가장 큰 위험은 에너지(전력)


중단의 가장 큰 위험은 사실 전력 문제예요. 응답자의 44%도 중단 사고의 주원인을 전력으로 지목하고 있어요. 데이터센터는 특성상 운영을 위해 많은 에너지를 필요로 해요. 데이터센터는 24시간 무중단으로 상시 가동되어야 하고, 데이터센터 내의 온도와 습도도 항상 일정히 유지해야 하기 때문이죠. 국제에너지기구에 따르면 2020년에 전 세계 데이터센터가 소비한 전력(200~250T Wh)이 남아프리카공화국(208T Wh, 16위)보다 많다고 해요.


실제로 국내 데이터센터들의 전력 사용량을 살펴보면, 2019년 기준 서울시의 에너지 다소비 건물 324개 중 14개가 데이터센터로 분류되었어요. 또한, 업종별 에너지사용량 및 단위 면적당 사용량이 많은 건물 상위 30개 중 데이터센터가 9개에 달하는 것으로 나타났고요.  


데이터센터에 투입되는 에너지를 절약하기 위한 방법 중 하나는 많은 에너지를 필요로 하는 냉각시스템의 개선이에요. 에너지경제연구원의 데이터센터 에너지 소비 분포에 따르면 절반인 50%가 냉방에 투입되고 있어요.


이에 친환경 에너지를 적극 이용하기 위한 기업들은 기발한 아이디어를 사용하는 중인데, 페이스북은 추운 환경을 활용한 냉각시스템을 위해 데이터센터 위치를 북극과 가까운 스웨덴 툴레오 지역으로 선정했고, 마이크로스프트는 해수를 이용한 냉각시스템을 위해 스코틀랜드 오크니섬 인근의 바닷속에 데이터센터를 구축했어요.


국내에서도 비슷한 사례로, 강원도-춘천시-한국수자원공사가 함께 소양강댐의 심층수를 이용해 데이터센터 냉각에 활용하며 동시에 데이터센터에서 배출되는 열을 인근 스마트팜이나 주택 난방에너지로 전환하는 시도가 계획되고 있어요.


▲ 마이크로소프트의 해수를 이용한 냉각시스템 소개 영상



정전을 겪어본 우리의 다음은


▲ 화재가 발생했던 성남 분당 SK C&C (출처 : 네이트 뉴스)


카카오의 홍은택 대표는 이번 사고의 일차적 원인은 화재가 일어난 SK C&C 데이터센터에 있으며, 이차적 원인은 화재와 같은 사고가 발생한 경우 서비스 장애 사태 복구 조치를 마련하지 못한 카카오에 있음을 밝혔어요. 그리고 사고로 인한 피해를 다잡기 위한 노력이 이어졌어요. 사고 후 카카오는 ‘피해사례 접수 및 분석’ > ‘피해자 지원 협의체’를 조성하여 피해 수습을 준비했어요.


사건 후 19일간 진행된 서비스 장애로 인한 피해사례 접수는 약 10만 건에 달했어요. 이 중 유료 서비스에 대한 피해 접수 건수는 17%, 무료 서비스 중 금전적 피해 관련 사례는 15%, 그 외 문의, 의견, 항의, 격려 등은 68%로 나타났어요. (출처 : 1015 피해 지원 방안을 안내드립니다, kakaocorp, 2022. 12. 29.)


사건 발생 한 달 후인 11월 21일 카카오는 피해자 지원을 위한 협의체(‘1015 피해지원 협의체’)를 열어 첫 회의를 개최했어요. 협의체는 소상공인연합회, 한국소비자연맹, 공정거래소비자보호 전문가 등으로 구성되었고, 40일 간의 10여 차례의 회의를 진행하며, 총 10만 여건에 달하는 피해 사례를 전수분석하여 크게 4가지의 해결책을 내놓았어요.(출처 : 출처 카카오, ‘1015 피해지원 협의체’와 함께 피해지원 방안 발표, kakaocorp, 2022. 12. 29.)  


1. 전 국민에게 사과의 의미로 이모티콘 3종 지원  

2. 비즈니스 파트너 대상 3만원, 5만원 현금 지급  

3. 전체 소상공인들에게 카카오톡 채널 5만원 무상캐시 지급  

4. 직접적인 피해가 큰 사례는 개별 지원 검토  


카카오의 피해 지원 방안도 중요한 만큼 동시에 카카오가 감당해야 하는 책임과 보상의 범위가 어디까지인지에 대한 물음도 생겨요. 특히나 앞에서 언급했던, ‘서버의 오래된 수명’, ‘구인난 문제’, ‘안정적인 전력 수급 문제’는 단일 기업이나 업계의 노력만으로도 해결 가능한 문제는 아니에요. 이들의 노력만으로 해결하는데 역부족이라면, 필요한 정부정책과 국회 입법은 무엇인지까지 파악해보는 계기가 되었으면 해요.


예를 들면, ‘화재에 취약한 배터리 사용에 대한 검토’, ‘개별 화재 감지센서 및 방화벽 설치’와 같이 다양한 재난 대응을 위한 데이터센터 업계의 충분한 고민, 데이터센터 분산을 통해 피해를 최소화한 네이버 사례와 같이 데이터센터를 사용하고 있는 기업의 데이터 분산 방안, 그리고 금융권 법으로 필수적으로 재난복구시스템(DR)을 구축하게 만들어 피해가 없었던 카카오뱅크 사례처럼, 비금융권 데이터센터에도 재난복구시스템 구축 적용 법 논의 및 적용 등이 떠올라요.


이번 사고로, 몸집만큼이나 커진 위험을 안고 있는 데이터센터를 위한 해결방안이 조속히 마련되기를 바라요. 돌이킬 수 없는 더 크고 심각한 대정전을 미리 막으려면요.(마침)




  참고

[기사] 카카오 플랫폼 제국의 민낯…‘연쇄 먹통’에 “이례적” 변명만, 정인선 기자, 옥기원 기자, 한겨레, 2022.10.16.

[기사] '127시간 30분' 카카오 정상화까지 걸린 시간…보상안 기준 되나, 강도림 기자, 서울경제, 2022.10.26.

[기사] "가동 중단 문제와 구인난 여전히 심각" 데이터센터 관련 동향 6가지, Ann Bednarz, ITWORLD, 2022.09.22.

[블로그] 전기 먹는 하마, 지구를 지키는 데이터센터 관리법, 현대오토에버, 2022.06.23.

[칼럼] 데이터센터의 안정성, 가용성, 유지보수 등 공인하는‘업타임 인증, dataonair, 2014. 04. 11.

[기사] 산업 디지털화 기반…데이터센터 현재와 미래, 최민식 기자, kharn, 2022.06.12.

[기사] 전 세계가 긴장하는 이슈 '반도체 공급난', 박정훈 기자, econovil, 2022.02.01.

[기사] 우리나라 인터넷 기록 고스란히…NHN 춘천 IDC 6월 오픈, 한세희 기자, 전자신문, 2013.05.05.

[기사] 국내 데이터센터, 체질 개선 필요하다, 윤진근 기자, MDS, 2016.05.13.

[기사] AI·클라우드 시대 급부상한 '데이터센터', 김지선 기자, 전자신문, 2021.03.16.

[기사] 연내 광주에 AI 데이터센터 들어선다…핵심인력 1260명 교육, 서동준 기자, 동아사이언스, 2022.01.24.

[기업보도] 카카오, ‘1015 피해지원 협의체’와 함께 피해지원 방안 발표, kakaocorp, 2022. 12. 29.

[기업보도] 1015 피해 지원 방안을 안내드립니다, kakaocorp, 2022. 12. 29.

[기사] 데이터센터 화재가 카카오 아닌 IT업계 비극이라는 카카오 CEO, 남미래 기자, invest chosun, 2022. 10. 19.


작가의 이전글 인싸 앱 ‘클럽하우스’를 아싸로  만든 새로운 혁신
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari