brunch

You can make anything
by writing

C.S.Lewis

by 마르코 Jul 12. 2017

데이터가 결정하는 세상 준비하기

SQL과 R이 무엇인지 궁금하다고요?

현재 파이썬/장고, 안드로이드, 아이폰 앱 개발 강의를 운영 중에 있습니다. 세 강의에 관심이 있으시거나, 이후 개설될 데이터 관련 강의에 관심이 있으신 분은 아래 링크 통해서 이메일 남겨주세요..

http://bit.ly/subscribe-imagineer



싱가포르 이주를 준비하면서 이런저런 사이트에 가입을 했더니, 하루에도 정말 많은 채용 정보가 날아온다. 그런데 채용 정보를 받아보면서 굉장히 흥미로운 점은 ‘기존에 개발의 분야가 아니라고 생각되던 분야’에서 마치 개발자를 뽑는 것 같은 기술을 요구한다는 것이다. 대게 이런 포지션은 Business Analyst라는 멋진 이름을 달고 나오는데 자세히 살펴보면 기존의 마케팅 업무와 데이터 분석 업무가 결합된 포지션이라는 걸 알 수 있다. 


최근에 번역한 글을 통해서 사람들의 이력서에 데이터 관련 기술이 곧 필수적인 기술로 등장할 것이라고 언급한 적이 있다. 그리고 이미 채용 시장에 현실로 펼쳐지고 있다.



아직 한국에는 이런 이야기가 별로 없는데 정말 이런 미래가 올까 의심스럽다면, 먼저 IT와는 전혀 상관없을 거 같은 아디다스를 한 번 살펴보자. 마케팅 & 커뮤니케이션 팀에서 사람을 뽑는데, Excel과 SQL, R을 요구하고, 학위에서 통계학이나 경제학을 우대한다고 한다. 



대표적인 실리콘밸리 IT 기업인 우버는 어떨까? 경제나 경영을 전공한 사람을 뽑으면서 SQL과 R에 대한 경력자를 찾고 있다. 



정말 안타까운 점은 지금 국내 그 어느 대학에서도 경영학과에서 SQL과 R을 가르치는 곳은 없을 텐데, 실제로 업계에서는 이런 분야의 전문가에 대한 수요가 점점 증가하고 있고, 이쪽 분야의 전문가를 찾지 못해 난리라는 것이다. 그렇다면 SQL과 R은 무엇일까?



SQL은 무엇인가?


SQL은 Structured Query Language의 약자로 데이터베이스와 상호작용하기 위한 언어이다. 데이터베이스는 아주 간단하게 설명하면 방대한 데이터 관리하면서 수많은 사용자가 데이터를 요청할 때도 문제없이 데이터를 제공할 수 있도록 도와주는 커다란 Excel이라고 생각하면 되겠다. 거의 우리가 사용하는 모든 웹이나 모바일 서비스의 뒤에는 이 데이터베이스가 숨겨져 있다. 데이터 저장을 저장할 수 있는 서비스라면 데이터베이스가 있다고 생각해도 크게 틀리지 않는다.


만약 왜 데이터베이스가 엑셀과 비슷하다면 엑셀을 쓰면 되지 SQL을 써서 데이터베이스에 자료를 불러와야 하냐고 묻는다면, 서비스에서 발생하는 모든 데이터가 축적되는 곳이 바로 데이터베이스기 때문이다. 물론 Excel도 데이터를 다루는 곳이라면 여전히 많이 사용한다. 만약에 보고 싶은 데이터가 있는데, 그 데이터를 매번 개발자에게 요청해야 한다면 어떨까? 한두 번 개발자에게 요청하는 것은 큰 문제가 아닐지도 모른다. 그런데 매번 이렇게 데이터를 개발자에게 요청한다는 것은 데이터를 요청하는 사람이 개발자를 업무를 방해한다는 '사소한' 사실을 넘어서, 실제로 어떤 데이터가 담겨있는지 모른다는 이야기도 된다. 


엑셀은 최대 데이터 개수에 한계가 있고, 데이터가 많으면 많을수록 버벅거림이 심해지는 반면에, 데이터베이스는 수년 이상 쌓인 데이터도 쉽게 가공할 수 있는 장점이 있다. 그리고 데이터베이스에 직접 접근하면 가장 최신 데이터를 볼 수 있다는 점은 말할 것도 없고.



R은 무엇일까? 


R에 대한 정의는 공식 사이트에 들어가면 아래와 같이 나온다. 

R is a language and environment for statistical computing and graphics. 


R은 컴퓨터로 통계를 하기 위한 언어이자 환경이자 시각화 도구라고 한다. 즉, 통계학적 지식을 이용하여 데이터를 가공하고, 이를 시각적으로 보여주는 도구라는 의미다. 


데이터는 그 자체만으로는 아무런 의미가 없다. 반드시 내가 원하는 주장을 뒷받침할 수 있게 가공되어야 하고, 데이터를 풍부하게 만들어주는 것은 바로 통계다. 그리고 아무리 나 혼자 아무리 데이터를 잘 이해했다고 하더라도, 다른 사람에게 설득하지 못하면 아무런 소용이 없다. 회사에서 발생하는 의사결정 과정은 대게 다른 사람과 함께 업무 하는 과정이기 때문에 그 설득을 위해서 데이터를 시각화하는 작업이 꼭 필요하다. 그리고 여기에 R이 사용이 된다.



배울 기술이 늘었다고 좌절하고 있을 필요는 전혀 없다고 생각한다. 물론 새로운 기술을 배우는 것이 절대로 쉬운 것이 아니고, 이것이 숙달되어 업무에 활용되기까지는 많은 시간이 걸리는 것도 사실이다. 하지만 새로운 기술이 소개된다는 것은 다른 사람들보다 빠르게 배운다면, 기존의 기술에 비해 손쉽게 전문가가 될 수 있다는 말이기도 하다.


항상 빠르게 새로운 기술에 관심을 갖고, 내 경력과 관련이 있다면 빠르게 배워서, 내 전문성과 이것을 결합하려는 노력이 사람을 돋보이게 만들어주는 방법이라고 믿는다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari