brunch

You can make anything
by writing

C.S.Lewis

by 최제힘 Sep 20. 2020

왜 하필 데이터 사이언스를 파이썬으로 시작했나요?

R도 조금 배워본 문과생이 현재 파이썬으로 numpy 모듈을 배우는 이유

데이터.... 데이터.... 데이터....!!!

수많은 단체들이 ‘모든 의사 결정을 데이터에 기반해서 한다!’라고 외치고 있다. 뭐 실제로 그럴지는 두고 봐야겠지만 아무튼 앞으로의 시대에서 데이터가 중요한 것임에는 이견이 없어 보인다. 내가 생각했던 데이터가 중요한 이유는 다음 링크에서 찾아볼 수 있다.


덧붙여 간단히 설명하자면 데이터 분석이란 개념은 원래 존재했지만, 스마트폰과 클라우드 컴퓨팅의 발전으로 인해 우리 실생활의 대부분이 데이터에 저장되면서 데이터 분석가에게 활용할 수 있는 재료들이 많아졌다.


따라서 데이터를 통해 가치 있는 발견을 할 수 있는 기회가 많아졌다. 최근에 무려 국가가 나서서 빅데이터 인재를 양성한다고 하니 말 다했다.



나와 같은 문돌이도 비록 데이터 사이언티스트는 아니더라도 내 관심 분야인 마케팅에서 의미 있는 인사이트를 얻기 위해 데이터 공부를 시작했다. 바로 파이썬으로!


데이터 분석계의 자강두천! 용호상박!

R에 잠깐 발을 담가봤던 사람으로서 왜 지금은 Python을 공부하고 있냐,라고 한다면 바로 확장성 때문이다. R은 데이터 사이언스만을 위해 만들어진 언어다. 따라서 데이터를 분석하고, 시각화하는 것에는 현재 파이썬 보다 더 좋은 퍼포먼스를 보여준다.


하지만 파이썬은 프로그램 및 웹사이트 개발 등 다양한 분야에서 이미 활용되고 있는 언어다. 또한 머신러닝이나 인공지능을 공부하게 될 때 파이썬이 요긴하게 쓰인다고 한다.


따라서 확장성이 있고, 좀 더 많은 교육 프로그램이 준비되어 있는 파이썬으로 데이터 공부를 시작하기로 결심했다.



아직 유치원 수준이지만, 현재는 파이썬에서 주피터 노트북(Jupyter Notebook)을 이용해서 Numpy 모듈을 학습하고 있다.


Numpy란?

 데이터 분석에는 수집, 정리, 시각화 등 해야 할 일들이 많은데, 데이터 분석만을 위해 만들어진 언어가 아닌 파이썬이 개발자의 계산 작업을 편하게 해 주기 위해 만들어진 모듈이다.


파이썬에는 Numpy 말고도 Pandas 등 데이터 분석을 도와주는 모듈이 많이 탑재되어있다. 그리고 데이터 분석을 위한 파이썬의 달리기는 아직도 현재 진행형이다.


손흥민 같은 R  VS 박지성 같은 Python

두 언어를 비교하면 이런 모습이 아닐까? R은 데이터 분석에 최적화되어 있어 연구소 등의 데이터 분석을 전문적으로 하는 기관에 적합한 반면에, Python은 여러 분야에 확장해서 적용이 가능해서 좀 더 민간기업에서 많이 쓰인다고 한다.


우선 나는 Python을 먼저 배우기로 했다. 파이썬을 익히며 데이터 분석을 실제로 해보고 R도 배워보고 싶다.


정리하며

데이터 분석 공부를 시작하려는 독자 분들은 어떤 언어로 공부를 시작할 예정인가요? 또 데이터 분석을 현재 하고 있는 실무자 여러분은 실제로 어떤 언어를 사용하시나요? 그리고 각 언어의 장단점은 무엇인가요?? 댓글로 의견 남겨 주시면 감사하겠습니다 :)


비상경계 문과생의 데이터 공부 도전기를 구독해 주시면 다음엔 더 풋풋하지만 성장의 동기부여를 줄 수 있는 포스팅을 찾아오겠습니다.


    

매거진의 이전글 비상경계 문과가 데이터 공부를 하고 있습니다
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari