분석 시간 확보를 위한 방법 (1)
작년 하반기부터 1인 데이터 분석가로 일하고 있다. 동료들이 퇴사하고 채용이 완료되지 않은 상황에서, 혼자서 데이터 분석, 분석 환경 구축, 에드혹 대응, 그리고 채용까지 다양한 업무를 책임지고 있다. 회사의 성장세 둔화로 더 많은 기여가 필요한 상황에서, 시간 관리는 필수가 되었다.
데이터 분석가라면 누구나 한 번쯤 경험했을 이런 상황에서, 어떻게 시간을 효율적으로 관리할 수 있을까? 이 글에서는 그 첫 번째 방법으로 데이터 추출 쿼리문을 체계적으로 저장하고 재활용하는 방법을 공유하고자 한다.
데이터 추출은 분석가의 주요 업무 중 하나지만, 종종 단순 반복 작업으로 인해 몰입도를 저해하고 많은 시간을 소모한다. 대부분의 분석가들은 "GCP 빅쿼리, AWS 아테나 같은 클라우드 환경", "DBeaver와 같은 로컬 쿼리 도구"에서 작업하지만, 추출 쿼리문을 체계적으로 저장하지 않거나, 저장하더라도 정리되지 않은 경우가 많다. 그러나 잘 정리된 쿼리문은 분석가의 귀중한 자산이 된다. 동일한 요청이 반복될 때 시간을 크게 절약할 수 있기 때문이다.
1. 디렉토리 구조 설계
효율적인 쿼리 관리를 위한 첫 단계는 명확한 디렉토리 구조를 설계하는 것이다. 이러한 구조는 제품별, 기능별로 쿼리를 분류하여 나중에 쉽게 찾을 수 있게 한다.
- 예:
```
data_analyst/
└── assets/
└── adhoc_query/
├── product_A/
├── product_B/
└── common/
```
2. 파일명 규칙 정하기
쿼리 파일명에 지라 티켓 코드를 포함시키는 것이 효과적이다. 이렇게 하면 요청-과정-결과를 하나의 키(지라 티켓 코드)로 연결하여 업무 추적이 용이해진다.
- 예: `[ABC-400] 신규유저 ABT 성과 확인.sql`
쿼리문 재활용은 최신 AI 도구와 함께 사용할 때 더욱 강력해진다. 이러한 방식으로 쿼리 작성 시간을 대폭 단축할 수 있다.
1. 기존 쿼리 수정하기
- 과거 작성한 쿼리를 Cursor나 Copilot에 태그하고 자연어로 수정 요구사항을 전달
- AI가 요구사항에 맞게 쿼리를 자동으로 튜닝
2. 새로운 쿼리 작성하기
- 참고할 여러 쿼리를 함께 태그하고 조합 방법을 설명
- AI가 새로운 쿼리의 초안을 즉시 생성
그동안 데이터 추출은 단순한 에드혹 업무로 여겨져 체계적으로 관리되지 않았다. 나 역시 현 직장 이전에는 쿼리 관리에 소홀했다. 하지만 Cursor, Copilot 같은 AI 도구의 등장으로 잘 정리된 쿼리 체계 가치는 더욱 높아질 것이다. 이제 쿼리 관리는 단순한 정리를 넘어 분석가의 생산성을 크게 향상시키는 핵심 자산이 될지는 모른다.
다음 글에서는 분석/추출 업무 과정에서 길을 잃지 않고 짧은 시간 안에 결과를 만들어내는 "분석 설계" 방법에 대해 다루겠다.