AI 시대에 데이터 분석가에게 더 중요해진 역량

by Maven

0-2. AI 시대에 데이터 분석가에게 더 중요해진 역량


AI 도구가 빠르게 확산되면서 데이터 분석가에게 요구되는 역량도 달라지고 있습니다.

과거에는 데이터를 다루기 위해 먼저 코드를 배워야 했습니다. SQL 문법을 익히고, Python으로 데이터를 불러오고, Pandas로 전처리하고, Matplotlib이나 Seaborn으로 그래프를 그리는 과정 자체가 꽤 높은 진입장벽이었습니다. 그래서 코드를 작성할 수 있다는 사실만으로도 어느 정도 경쟁력이 있었습니다.


하지만 이제는 상황이 달라졌습니다.

생성형 AI에게 요청하면 SQL 쿼리 초안을 받을 수 있습니다. Python 전처리 코드도 만들 수 있습니다. 그래프를 그리는 코드도 생성할 수 있고, 머신러닝 모델 학습 코드도 어느 정도 자동으로 작성할 수 있습니다. 심지어 분석 결과를 요약하는 문장이나 보고서 초안까지 도움받을 수 있습니다.


이 변화는 데이터 분석가에게 위기이기도 하고 기회이기도 합니다.

위기인 이유는 단순 코딩 능력만으로는 더 이상 강한 차별점을 만들기 어려워졌기 때문입니다. 예전에는 “Python으로 데이터를 분석할 수 있습니다”라는 말이 충분히 매력적으로 들렸을 수 있습니다. 하지만 이제는 많은 사람이 AI의 도움을 받아 비슷한 수준의 코드와 그래프를 만들 수 있습니다.


반대로 기회인 이유는, AI를 잘 활용하는 사람은 더 빠르게 분석을 시도하고, 더 다양한 가설을 검토하고, 더 많은 관점에서 데이터를 바라볼 수 있기 때문입니다. 중요한 것은 AI를 쓰느냐 쓰지 않느냐가 아닙니다. AI가 만든 결과를 어떻게 이해하고, 검토하고, 수정하고, 자신의 판단으로 바꾸느냐입니다.


앞으로의 데이터 분석가에게 더 중요해지는 역량은 단순히 코드를 많이 아는 능력이 아닙니다.

오히려 다음과 같은 역량이 더 중요해지고 있습니다.


문제를 제대로 정의하는 능력.
좋은 지표를 설계하는 능력.
데이터를 해석하는 능력.
분석 결과를 쉽게 설명하는 능력.
AI가 만든 결과를 검토하고 판단하는 능력.


이 역량들은 포트폴리오에서도 반드시 드러나야 합니다.




단순 코딩 능력의 희소성은 낮아지고 있습니다


코딩 능력이 중요하지 않다는 뜻은 아닙니다. 데이터 분석가에게 SQL과 Python은 여전히 중요한 기본기입니다. SQL을 모르면 필요한 데이터를 직접 추출하기 어렵고, Python을 다루지 못하면 전처리와 분석 자동화에서 한계가 생깁니다. 다만 “코드를 작성할 수 있다”는 사실만으로는 충분하지 않다는 뜻입니다.


예를 들어 포트폴리오에 이런 내용이 있다고 해보겠습니다.


SQL로 데이터를 추출했습니다.
Python으로 전처리했습니다.
Matplotlib으로 시각화했습니다.
RandomForest 모델을 사용했습니다.
정확도는 86%였습니다.


이 문장들은 기술적으로는 문제가 없어 보입니다. 하지만 채용담당자 입장에서는 궁금한 점이 남습니다.


왜 그 데이터를 추출했나요?
어떤 기준으로 전처리했나요?
왜 그 그래프를 그렸나요?
왜 RandomForest를 선택했나요?
정확도 86%는 실무적으로 어떤 의미가 있나요?
그 결과를 바탕으로 어떤 의사결정을 할 수 있나요?

AI 시대에는 코드 자체보다 코드 앞뒤의 판단이 더 중요해집니다.


AI는 코드를 만들어줄 수 있습니다. 하지만 “무엇을 분석해야 하는지”를 처음부터 제대로 정해주지는 못합니다. AI는 그래프를 그려줄 수 있습니다. 하지만 “이 그래프가 비즈니스적으로 어떤 의미인지”를 회사의 맥락에 맞게 책임지고 판단하지는 못합니다. AI는 모델을 추천해줄 수 있습니다. 하지만 “이 모델 결과를 실제 업무에 적용해도 되는지”를 최종적으로 책임지는 것은 사람입니다.


따라서 포트폴리오에서도 단순히 코드 캡처를 많이 넣는 방식은 점점 약해질 수밖에 없습니다.

이제 중요한 것은 이런 흐름입니다.


어떤 문제를 풀기 위해 이 코드를 썼는가.
어떤 판단을 하기 위해 이 그래프를 만들었는가.
어떤 의사결정을 돕기 위해 이 모델을 사용했는가.
AI의 도움을 받았다면, 어떤 부분을 참고했고 어떤 부분을 직접 검토했는가.


즉, 코딩 능력은 기본기입니다. 하지만 포트폴리오에서 차별화를 만드는 것은 코딩 그 자체가 아니라, 코드를 사용하는 목적과 판단 과정입니다.




문제 정의 능력이 더 중요해지고 있습니다


데이터 분석 프로젝트는 데이터에서 시작하는 것처럼 보이지만, 실제로는 문제에서 시작해야 합니다.

많은 포트폴리오가 약해지는 이유는 처음부터 데이터만 보고 출발하기 때문입니다.


“이 데이터셋이 있으니까 분석해보자.”
“컬럼이 많으니까 시각화해보자.”
“분류 문제로 만들 수 있으니까 모델링해보자.”


이런 방식으로 시작하면 분석은 할 수 있습니다. 하지만 포트폴리오로서의 설득력은 약해집니다. 왜냐하면 읽는 사람 입장에서 가장 중요한 질문에 답하지 못하기 때문입니다.


“그래서 왜 이 분석을 했나요?”


문제 정의는 데이터 분석 프로젝트의 출발점입니다. 문제 정의가 약하면 이후 과정도 모두 약해집니다. 지표도 흔들리고, EDA도 산만해지고, 모델링도 목적을 잃고, 결론도 모호해집니다.

예를 들어 “고객 데이터를 분석한다”는 문제 정의가 아닙니다. 너무 넓고 모호합니다.


다음과 같이 바뀌어야 합니다.


"첫 구매 이후 14일 내 재방문하지 않는 고객군의 행동 특성을 분석해,

이탈 위험 고객을 조기에 식별하고 리텐션 캠페인 우선순위를 제안한다."


이 문장에는 분석 대상, 문제 상황, 판단 기준, 최종 목적이 들어 있습니다.


- 분석 대상 : 첫 구매 고객
- 문제 상황 : 14일 내 재방문하지 않는 고객군
- 분석 목적 : 이탈 위험 고객 조기 식별
- 비즈니스 목적 : 리텐션 캠페인 우선순위 제안


이렇게 문제를 정의하면 이후 분석 흐름이 자연스럽게 만들어집니다.


어떤 데이터를 봐야 할까요?
첫 구매일, 재방문일, 구매 주기, 유입 경로, 구매 금액, 카테고리, 쿠폰 사용 여부 등을 볼 수 있습니다.


지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.

brunch membership
Maven작가님의 멤버십을 시작해 보세요!

데이터를 분류하고 분석하는 업무를 매일 하고 있지만, 아직도 데이터가 어렵고 무서운 '이류 분석가' 회사원입니다.

223 구독자

오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠

  • 최근 30일간 9개의 멤버십 콘텐츠 발행
  • 총 69개의 혜택 콘텐츠
최신 발행글 더보기
매거진의 이전글더 어려워진 데이터 분석 취업 시장