brunch

You can make anything
by writing

C.S.Lewis

by 김명희 Nov 25. 2019

서버 관리자는 외로워

시스템 엔지니어 경험 기록

나의 첫 회사는 인터넷 서비스를 하는 작은 중소기업이었다. IT 서비스가 메인이었지만 IT 인력이 많지는 않았다. 내가 속한 팀에서 개발도 하고 서버 관리도 담당했었다. 팀에는 팀장 한 명 그리고 신입인 나 이렇게 두 명이었다. 하지만 팀장은 6개월 만에 회사를 떠났고 인력 충원도 없었다. 6개월짜리 신입이 개발도 하고 서버 관리도 맡아야 했다.


지금은 개발자로 완전히 전향했다. 당시 2년 5개월 정도 재직하며 서버 관리를 맡았다. 서버 관리자라고 부르는 좀 더 전문적으로 시스템 엔지니어라고 부르는 직군을 경험한 기록을 남겨보려고 한다. 작은 회사라 혼자서 해야 했기에 느꼈던 감정이지만 일단 서버 관리자라는 직군은 무척 외롭다고 느꼈다. 아이를 낳고 부모가 되어 보니 서버 관리라는 게 아이를 키우는 느낌이다. 말도 없고 갑자기 아프고 꼭 주말에 아프고 그것도 밤에 아픈 아이처럼 말이다.




1. 문제가 발생하면 진땀이 나지요

웹 서비스를 하는 회사였기에 서비스는 항상 접속이 가능해야 한다. 접속이 안되면 매출에도 문제가 발생하고 불시에 접속한 사람들에게 안 좋은 이미지를 심준다. 문제가 생겨도 빠르게 복구가 가능해야 한다. 하지만 그렇게 빠르게 복구할 수 있는 문제였다면 심각한 문제를 일으키지도 않는다. 심각한 원인이기에 빠르게 복구할 수가 없는 것이다.

일단 문제가 발생하면 여기저기 가능한 곳에 빠르게 연락해서 원인을 찾아야 한다. 경험 없는 초짜 관리자에게 표준 절차라는 게 있을 리 없다. 그런 게 있었으면 절차에 따라 대응할 수 있으므로 정확하고 빠르게 대응이 가능했을 텐데 일단 나는 의심 나는 곳부터 담당자에 전화를 돌리며 원인을 찾았다. 또 그럴 수밖에 없는 게 윗분들이 뒤에 와서 여기에 전화해봐라 저기에 연락해봐라 지시를 내린다. 사이트 중단 시간이 길어지면 종국에는 사장님까지 뒤에 와 계신다. 진땀이 안 날 수 있나.



2. 24/7

IT 업계에서 자주 쓰이는 이 용어는 24시간 7일 동안 서비스를 한다는 얘기다. 그러니까 무중단이란 얘기다. 웹 서비스에 중단은 없어야 한다. 퇴근 후에 여자 친구를 만나고 있어도 주말에 친구들과 술 한잔을 하고 있어도 밤에 자다가도 서버에 문제가 발생하고 사이트에 이상이 생기면 연락이 오고 대응을 해야 한다. 외부에 있었다면 PC방에라도 가서 대응을 해야 하고 서버가 위치해있는 IDC와 멀리 떨어져 있다면 택시를 타고 가서라도 빠르게 대응해야 한다. 그래서 항상 약간의 긴장 상태를 유지해야 한다. 담당자나 모르는 번호로 연락이라도 오면 심장이 쿵 내려앉는다. '문제 생겼구나.' 그리고 문제라는 녀석은 야간이나 주말을 좋아해서 꼭 그때 발생한다.



3. 중요 작업은 주말에 합시다

서버와 관련한 작업은 보통 시스템을 끄고 하거나 재시작을 해야 한다. 끄거나 재시작을 하면 당연히 서비스를 중단해야 하는데 그래서 이런 작업은 보통 접속자가 많지 않은 야간에 한다. 야간이라는 시간도 12시간 정도의 제한이 있다. 작업이 길어질 거 같으면 주말 야간에 해야 한다. 남들 다 쉬는데 나 혼자 일해야 한다는 사실에 기분이 좋을 리가 없다. 문제없이 잘 끝난다는 보장도 없으니 부담감도 크다. 이렇게 날려먹은 주말은 돈이나 대체 휴일로 보상도 되지 않았다. 그저 당연하다는 듯이 나와서 문제없이 끝내고 월요일에 출근하면 되는 것이다. 명절에 은행권에서 시스템 작업으로 중단 안내 문자가 오면 그날 IDC에서 고생할 시스템 엔지니어들이 눈에 선하다.



4. 많은 문제는 재부팅으로 해결됩니다

담당자들이 여럿이 모여도 원인을 찾지 못하는 문제가 있다. 그때는 대부분의 의견이 재부팅? call? 로 모아져 간다. 그리고 재부팅하면 또 귀신같이 해결되곤 한다. 물론 아무 때나 재부팅을 할 수는 없다. 하지만 도무지 원인을 못 찾고 서비스에 심각한 영향을 미친다면 과감히 재부팅도 시도해 봐야 한다. 그러나 재부팅도 위험 부담이 있다. 오래된 서버는 재부팅하면 아예 부팅이 되지 않는 경우도 있다. 그럼 망하는 거다. 오래된 서버는 재부팅만이 답이 아니다.



5. 시간차는 확인해 봤나요?

또 원인을 해결 못하는 문제가 있다. 그때 많은 문제가 서버와 서버 간의 또는 서버와 실제의 시간차 때문에 발생하곤 한다. 상대성 이론이 적용될 만큼 중력이 강하지 않으니 서버와 서버 간에는 시간이 정확히 맞아야 한다. 이 시간차 때문에 다양한 문제가 발생하고 여러 사람의 골머리를 썩힌 후에야 해결이 되는데 시간차 맞추는 명령어는 정말 짧고 간단해서 실행하는데 1초도 안 걸린다. 이럴 경우 원인을 찾아도 기쁘기보다 무척 허탈해진다.



6. 이렇게 많은 사람을 언제 만나볼까

개발자 일을 하면 사람 만날 일이 많지 않다. 서버 관리자는 만날 사람이 무척 많다. IDC 담당자들도 만나야지, 서버 관리해주는 업체 영업팀, 기술팀도 만나야지, 장비하나 사려면 또 장비업체 영업팀, 기술팀 만나야지 정말 많은 사람들을 만나게 된다. 견적 받고 일을 조율하고 문제가 생기면 연락해서 지원을 받는 등 중간자 역할을 잘해야 한다.

이때만 해도 내가 갑 회사였는데 을 회사로 와서 다양한 갑질을 경험해보니 어떻게 하면 을과 잘 일할 수 있는지 보인다. 무리한 요구를 하지 않고 담당자를 믿고 회사에 왔을 때 따뜻한 커피 한잔 건네면 갑질에 지쳐있는 을은 하나라도 더 챙겨주고 싶은 마음이 생긴다. 신뢰와 인간대 인간으로서 사람을 대하면 서로에게 도움이 되는 것이다. 지금은 그때 만났던 많은 사람들과 다 연락이 끊겼다. 나름 잘 챙겨줬다고 생각하는데 그들은 나를 어떻게 느꼈을지.



7. PC관리, 소프트웨어 관리, 사내 네트워크 관리...

보통은 이런 거 담당하는 별도팀이 있기 마련인데 작은 회사이고 IT에 대해서 좀 안다는 이유로 서버 관리자가 이런 거를 전부 담당했다. PC에서 뭐가 안된다면 가서 봐줘야 하고 사내 네트워크에 문제가 있으면 점검도 했다. 누가 신고를 해서 그런 건지 불법 OS 사용 관련해서 신고가 들어와 급하게 윈도 라이선스를 사야 하기도 했다. 다양한 업무에 지루할 틈이 없었지만 사실 이런 건 일이라고 할 수가 없어서 내가 왜 이런 것 까지 해야 하나 하는 마음이 더 컸다.



8. 100kg 유닉스 머신 옮기기 대작전

IDC에 용도가 중단된 유닉스 머신이 있었다. 이걸 사내로 옮기기로 결정했다. 유닉스 머신은 대용량 시스템에 사용하기 위한 크기도 크고 무거운 서버인데 회사 규모에 걸맞지 않게 이런 걸 갖추고 있었다. 서버는 아주 조심해서 옮겨야 했는데 서버를 관리하는 업체 담당자 두 명과 같이 옮겼다. 그런데 하필 불길하게도 그날 비가 왔다. 전자 장비는 수분에 취약하니 걱정이 앞섰다. 퀵에 서버를 옮겨 싣고 회사에 도착. 당시 회사가 2층인데 하필 그 순간 엘리베이터를 점검해서 사용할 수 없단다. 오 마이 갓.

유닉스 서버의 무게가 100kg 정도였다. 충격에 취약해 조심해서 옮겨야 한다. 계단으로 옮겨야 하는데 개발팀 남자 인원들을 다 불렀다. 좁은 계단을 100kg짜리, 길이도 긴 서버를 남자들이 들고 딱 한층 올라가는데 무척이나 애를 먹었다. 죽는 줄 알았다. 겨우 도착하니 팔다리가 후들후들.



9. 실패가 성공의 어머니?

필요에 의해 스토리지 장비를 하나 구매했다. 견적 받고 기안 올리고 장비를 받아서 세팅하고 모든 과정이 처음이라 낯설어도 재미있었고 한 단계 더 발전했다는 느낌이 들었다. 그런데 이 장비를 사이트에 연결하기만 하면 접속이 안 되는 장애가 발생했다. 연결을 해제하면 잘 되고 연결을 하면 문제가 발생하고. 야간에 연결하고 나면 아무 문제없다가 주간에 접속자가 몰리는 시간에 꼭 문제가 발생했다. 장비를 납품한 업체의 기술 담당자와 며칠 밤을 고생했다.

많은 대안이 오가고 여러 사람이 불려 다녔지만 최종적으로 구매한 스토리지는 반품하기로 결정했다. 굉장히 허탈하고 나에게 실망스러웠으며 여러 사람에게 미안했다. 초보 관리자였던 나에게 상황을 해결할 지식도 경험도 없었다. 좋은 대안을 제시할 수도 없었고 그저 시키는 대로 움직이며 상황이 흘러가는 걸 지켜봐야만 했다. 영업 담당자와도 꽤나 친분이 있었는데 반품을 오롯이 떠안아야 하는 그에게도 무척 미안했다. 내가 지금과 같은 지식과 경험이 있었다면 결과가 달랐을까? 적어도 그 일이 이렇게 무기력한 기억으로 남아있지는 않았을 것이다. 서버 관리자라는 게 전문성 없이 아무나 할 수 있는 일이 아니라는 것도 느꼈다.



10. IDC의 밤은 길다

수많은 서버들의 하우스 IDC. 층층이 쌓인 서버들은 무정하지만 뜨거운 존재라는 듯이 엄청난 열기를 내뿜고 이 열기를 식히기 위해 수많은 에어컨이 냉기를 뿜어낸다. 습기도 없고 냉기와 소음만 가득한 IDC. 여름에는 천국에 근접하지만 겨울에는 냉지옥이다.

답답한 공기와 추위, 소음에 지쳐가지만 작업은 쉽게 끝날 줄 모른다. 새벽 시간이지만 IDC의 불은 꺼지지 않는다. 이 시간에도 작업하는 사람들이 제법 있다. 따뜻한 말 한마디라도 건네고 주고받고 하면 좋겠지만 서로 빨리 작업을 끝내고 집에 가서 쉬고 싶은 마음뿐이다. 다들 감정이 느껴지지 않는 무정한 상태.

일이 잘 안 풀려 잠시 쉬러 밖으로 나온다. 겨울의 새벽, 기온이 낮다. 새벽에도 지나다니는 차들이 있다. 간혹 지나가는 차의 소음이 무척 크게 들린다. 작업이 잘 끝나야 하는데 마음이 무겁다. 담당자가 나 혼자이니 도와줄 사람도 없다. 내가 이렇게 작업하고 있는 걸 아는 사람도 없다. 외롭다는 생각이 밀려온다.

자판기에서 커피 한잔 뽑아 든다. 맛으로 먹는 건 아니다. 그저 정신을 차리기 위한 카페인이 필요할 뿐. 작업 시간이 길어질수록 초조해진다. 해결하지 못할 것 같다는 생각과 해결해야 한다는 의무가 충돌한다. 답을 찾아보자. 문제를 해결할 사람은 나밖에 없다.






당시에 만났던 시스템 엔지니어들은 말없이 묵묵히 자기 일을 해내는 사람들이었다. 밤이고 낮이고 주말이고 문제가 생기면 출동하고 해결하면 조용히 돌아서는 사람들.

3년이 채 안 되는 서버 관리자 경험이었다. 뭘 해봤다고도 할 수 없고 안다고도 할 수 없는 무척 짧은 시간이었다. 내가 느꼈던 외롭다는 생각은 혼자서 일하며 실력까지 부족했기에 생긴 감정일 것이다. 하지만 잠시나마 동병상련의 감정을 가지고 바라본 그들에게서도 외로움을 느꼈다면 잘못된 감정이었을까?


오늘도 끝날 줄 모르는 작업에 매달려 있는 시스템 엔지니어분들, 파이팅하시길.

작가의 이전글 항상 옳은 선택을 할 수는 없지만
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari