brunch

데이터 사이언티스트의 첫 번째 무기

커리어 확장의 시작점에서 내가 가장 먼저 손에 쥔 도구, SQL

by Dr Vector

데이터 사이언티스트로서 첫 발을 내디뎠을 때를 기억해 본다.

그때의 고민과 결심은 https://brunch.co.kr/@drvector/2 여기에 기록해 두었다.


현업에서 수년간 데이터 사이언티스트로 일해보니,

어느 곳에서도 공통적으로 요구되는 기본기가 무엇인지

이제는 조금 말할 수 있게 되었다.

이 글은 데이터 사이언티스트의 길을 걷고자 하는 누군가를 위해,

그리고 초심이 옅어질지 모르는 미래의 나를 위해,

그때의 시작과 배움을 기록해 두는 일종의 회고록이다.

ChatGPT Image 2025년 7월 22일 오후 04_23_43.png SQL을 시작으로 확장되는 데이터의 세계

# 첫 번째 무기, SQL

데이터 사이언티스트로서 가장 먼저 손에 쥔 도구는

바로 SQL이었다.

학부 수업 외 프로그래밍을 정식으로 배운 적은 없었어도

코드에 대한 기초적인 개념이나

베이식 언어에 대한 이해는 갖고 있었기에

처음 SQL을 익히는 데 큰 장벽은 없었다.


감사하게도 당시 회사 동료가 데이터 스키마 구조와 쿼리의 기초를 간단히 설명해 주었고,

그 내용을 토대로 하루이틀 검색하고 예제를 따라 해 보며 감각을 익혔다.

실제 데이터로 직접 쿼리를 짜서 간단한 데이터 추출을 직접 해보며,

결과가 원하는 대로 나왔는지 확인했다.

문법을 조금씩 익히니 금방 쿼리를 작성할 수 있게 되었고, 데이터베이스와의 소통이 그렇게 시작되었다.


# 데이터 탐험

이후에는 데이터 웨어하우스를 찬찬히 들여다봤다.

어떤 테이블이 있고, 어떤 column이 있고, 어떤 지표를 어떻게 계산해서 쓰는지

이미 사용되고 있는 쿼리를 참고하고, 내 식대로 짜보았다.

이렇게 하니 주요 지표의 정의, 맥락, 흐름을 동시에 습득하게 되었고,

자연스럽게 SQL 실력도 빠르게 성장했다.

2주쯤 지나니 내가 주도적으로 다루는 주제들을 소소하게나마 만들었고,

작지만 분명한 성취감도 따라왔으며, 이 일에 대한 자신감도 생겼다.


# 몰입의 즐거움

지금 돌이켜 보면,

그때 SQL을 너무나도 재미있게 배웠던 경험이

지금도 데이터 사이언스를 좋아하게 된 이유라고 생각한다.

아무리 복잡한 데이터 전처리나 추출 과정도 완전히 몰입하여

raw data를 좋은 품질의 데이터로 정제할 수 있다는 점.

"좋은 데이터를 사용해야 좋은 결과가 나온다."


# 가장 강력한 도구, 가장 기본적인 스킬

분석이든 시각화든 모델링이든,
모든 데이터 작업은 결국 “무엇을, 어떻게 가져올 것인가”에서 시작된다.
대용량 데이터를 빠르게 탐색하고,

정제된 형태로 가공하는 데 있어
SQL은 지금도 제가 가장 자주 사용하는 도우기아.


누군가 데이터사이언티스트가 되기 위해 무엇을 먼저 배우면 좋겠느냐고 묻는다면 나는 이렇게 답한다.

“SQL부터 배우세요. 반드시 손에 익혀야 할 첫 번째 도구입니다.”

keyword
작가의 이전글눈 딱 감고, 해야 하는 순간들