brunch

You can make anything
by writing

C.S.Lewis

by Jenny Jang Nov 08. 2022

빅 데이터 분석, 프로그래밍이 필수인가요?

분석 프로그램, 필요 프로그래밍 언어 (파이썬, SQL)

프로그래밍은 데이터 분석에서는 빠질 수 없는 기술 중 하나입니다. 물론 분석 모델을 개발하는 직종인 경우에는 필수 중 필수이고, 분석 모델을 개발하는게 아닌 분석하는 직무(애널리스트, 기획자 등)의 경우, 필수는 아니지만 알아두면 좋은 자산입니다.

데이터 애널리스트 관점에서 프로그래밍은 필수는 아니지만, 할 수 있다면 다양한 오픈소스나 자동화 기술을 사용할 수 있습니다.

데이터 사이언티스트인 경우, 코딩은 필수 능력이라고 할 수 있습니다. 

결국 어떤 직무가 되든지 간에, 코딩 능력은 궁극적으로 이 분야의 커리어를 제대로 쌓기를 원한다면 필수로 가져야 하는 능력입니다.

프로그래밍을 못한다면?

KNIME, RapidMiner과 같은 데이터 분석 소프트웨어를 활용하면 최소한의 프로그래밍 지식으로도 데이터 분석이 가능합니다! 



빅 데이터 분석, 어떤 프로그래밍 언어를 배워야 할까요?












파이썬 


데이터 사이언티스트 직종에서는 파이썬 및 R이 가장 인기가 많은 걸로 나타납니다.

(개발에 쓰이지는 않는 마크업 언어인 html, SQL은 제외, 덧붙이자면 마케터의 도메인 성격을 갖는 동시 데이터 사이언티스트를 하기 위해서는 SEO 마케팅 지식을 최대화 하기 위해 html 정도는 보고 이해할 수 있어야 합니다.)




파이썬의 장점은


인터프리터식 언어로 컴파일 없이 실행이 가능하고,

프로그래머가 프로그램 결과를 바로 확인할 수 있으며,

가독성이 좋다는 것입니다.

또한 확장성이 좋아, 수많은 오픈소스를 쉽게 이용 할 수 있습니다. 



즉, 파이썬은 사용하기 쉽고 인터프리터 기반의 고급 프로그래밍 언어입니다. Python은 다양한 역할을 위한 방대한 라이브러리가 있는 다용도 언어입니다.. Python은 코드 가독성 또한 좋아 데이터 사이언티스틀이 좋아하는 언어입니다. 왜냐, 데이터 사이언티스는 복잡한 문제를 다루기 때문에 이해하기 쉬운 언어를 사용하는고 싶어하기 때문입니다.



Python에는 Pandas, Numpy, Matplotlib, SciPy, scikit-learn 등과 같은 전용 라이브러리가 있으며. 또한 Tensorflow, Keras 및 Pytorch와 같은 고급 Python 라이브러리는 데이터 사이언티스트를 위한 딥 러닝 도구를 제공합니다.


이외 R 언어 또한 매우 사용성이 크지만, 파이썬 정도만 설명하고 넘어가도록 하겠습니다.





SQL


'데이터 사이언스의 필수 스택"인 SQL은 빅데이터 직무에서 가장 중요한 역량입니다

. SQL 또는 'Structured Query Language'는 관계형 데이터베이스라고 하는 조직화된 데이터 소스에서 데이터를 검색하기 위한 데이터베이스 언어입니다. 


데이터 과학에서 SQL은 데이터베이스 업데이트, 쿼리 및 조작을 위한 것을 의미합니다. 데이터 사이언티스트로서 데이터를 검색하는 방법을 아는 것은 작업에서 가장 중요한 부분입니다. SQL은 데이터 과학자의 '보조 무기'로, 제한된 기능을 제공하지만 특정 역할에 중요합니다. MySQL, SQLite, PostgreSQL 등과 같은 다양한 구현이 가능합니다.


 능숙한 데이터 사이언티스트가 되려면 데이터베이스에서 데이터를 추출하고 랭글링해야 합니다. 이를 위해서는 SQL에 대한 지식이 필수입니다. SQL은 선언적 구문으로 인해 가독성이 높은 언어이기도 합니다. 


예를 들어 SELECT 이름 FROM 사용자 WHERE 급여 > 20000 처럼 직관적인 방식을 보여줍니다. 






자료 구조와 알고리즘



자료 구조란, 데이터의 효율적인 접근과 수정을 위해 데이터를 표현하는 방식으로, 알고리즘의 재료가 됩니다.

여기서 알고리즘은 컴퓨터에게 인간의 지시에 따라 명령을 수행할 수 있는 메뉴얼을 제공하는 것을 의미합니다.



자료 구조의 종류


(1) 선형 구조

-리스트, 스택, 큐


(2) 비선형 구조

-트리, 그래프



알고리즘의 종류


(1) 정렬 - 버블 정렬, 병합 정렬, 퀵 정렬

(2) 탐색 - 트리 탐색




파이썬 배우기 


정말 다양한 루트로 파이썬을 배울 수 있는데요,

유데미 코스 뿐만 아니라 에드 위드에서 한글로 무료로 배울 수도 있습니다.

https://www.edwith.org/pythonforeverybody

하지만 우리가 알파벳만 안다고 해서 영어를 잘하는 것이 아니듯이

파이썬도 마찬가지입니다. 개발 언어를 배우기만 해서 개발을 할 수 있는 것이 아닙니다.

작은 소형 프로젝트라도 스스로 실습하면서 해야 가장 실력이 빨리 느는 것 같습니다.



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari