커리어 확장의 시작점에서 내가 가장 먼저 손에 쥔 도구, SQL
데이터 사이언티스트로서 첫 발을 내디뎠을 때를 기억해 본다.
그때의 고민과 결심은 https://brunch.co.kr/@drvector/2 여기에 기록해 두었다.
현업에서 수년간 데이터 사이언티스트로 일해보니,
어느 곳에서도 공통적으로 요구되는 기본기가 무엇인지
이제는 조금 말할 수 있게 되었다.
이 글은 데이터 사이언티스트의 길을 걷고자 하는 누군가를 위해,
그리고 초심이 옅어질지 모르는 미래의 나를 위해,
그때의 시작과 배움을 기록해 두는 일종의 회고록이다.
# 첫 번째 무기, SQL
데이터 사이언티스트로서 가장 먼저 손에 쥔 도구는
바로 SQL이었다.
학부 수업 외 프로그래밍을 정식으로 배운 적은 없었어도
코드에 대한 기초적인 개념이나
베이식 언어에 대한 이해는 갖고 있었기에
처음 SQL을 익히는 데 큰 장벽은 없었다.
감사하게도 당시 회사 동료가 데이터 스키마 구조와 쿼리의 기초를 간단히 설명해 주었고,
그 내용을 토대로 하루이틀 검색하고 예제를 따라 해 보며 감각을 익혔다.
실제 데이터로 직접 쿼리를 짜서 간단한 데이터 추출을 직접 해보며,
결과가 원하는 대로 나왔는지 확인했다.
문법을 조금씩 익히니 금방 쿼리를 작성할 수 있게 되었고, 데이터베이스와의 소통이 그렇게 시작되었다.
# 데이터 탐험
이후에는 데이터 웨어하우스를 찬찬히 들여다봤다.
어떤 테이블이 있고, 어떤 column이 있고, 어떤 지표를 어떻게 계산해서 쓰는지
이미 사용되고 있는 쿼리를 참고하고, 내 식대로 짜보았다.
이렇게 하니 주요 지표의 정의, 맥락, 흐름을 동시에 습득하게 되었고,
자연스럽게 SQL 실력도 빠르게 성장했다.
2주쯤 지나니 내가 주도적으로 다루는 주제들을 소소하게나마 만들었고,
작지만 분명한 성취감도 따라왔으며, 이 일에 대한 자신감도 생겼다.
# 몰입의 즐거움
지금 돌이켜 보면,
그때 SQL을 너무나도 재미있게 배웠던 경험이
지금도 데이터 사이언스를 좋아하게 된 이유라고 생각한다.
아무리 복잡한 데이터 전처리나 추출 과정도 완전히 몰입하여
raw data를 좋은 품질의 데이터로 정제할 수 있다는 점.
"좋은 데이터를 사용해야 좋은 결과가 나온다."
# 가장 강력한 도구, 가장 기본적인 스킬
분석이든 시각화든 모델링이든,
모든 데이터 작업은 결국 “무엇을, 어떻게 가져올 것인가”에서 시작된다.
대용량 데이터를 빠르게 탐색하고,
정제된 형태로 가공하는 데 있어
SQL은 지금도 제가 가장 자주 사용하는 도우기아.
누군가 데이터사이언티스트가 되기 위해 무엇을 먼저 배우면 좋겠느냐고 묻는다면 나는 이렇게 답한다.
“SQL부터 배우세요. 반드시 손에 익혀야 할 첫 번째 도구입니다.”