brunch

데이터 분석은 문제 정의에서 시작된다

[파트1. 데이터 리터러시 이해]

by 구자룡

<생각해 볼 문제>


"데이터 분석을 왜 배워야 하며, 무엇부터 시작해야 할까요?"


업무 연차 2년 차. 데이터를 공부해본 적도 없는데 갑자기 데이터 기반 보고서를 작성하라는 지시를 받았습니다. 마케팅 기획자도, 인사 담당자도, 기획실 팀원도 비슷한 상황에 놓여 있습니다. 실제로 문제를 겪은 이들이 하나같이 말하는 공통점은 “도대체 어디서부터 시작해야 할지 모르겠다”는 것입니다. 분석 툴을 배우는 것이 우선일까요? 아니면 통계 개념부터 익혀야 할까요? 그보다 먼저 반드시 해야 할 것이 있습니다. 바로 '문제 정의'입니다. 데이터 분석은 문제에서 시작되며, 그 목적이 명확하지 않으면 분석은 방향을 잃게 됩니다.


문제 정의가 없는 데이터 분석은 목적지 없이 떠나는 여행과 같습니다. 수많은 데이터를 분석하고도, 그 분석이 실질적인 인사이트나 전략으로 이어지지 못하는 경우가 흔합니다. 따라서 분석의 출발점은 늘 '왜 이 분석을 하는가?'라는 질문에서 시작해야 합니다. 목적 없는 분석은 시간 낭비일 뿐 아니라 잘못된 해석으로 인해 오히려 조직에 혼란을 줄 수 있습니다.



분석은 ‘문제 정의’에서 시작된다


많은 사람들이 데이터 분석 공부를 시작할 때 가장 먼저 엑셀이나 파이썬 같은 도구부터 배우기 시작합니다. 하지만 이것은 ‘수단’일 뿐 ‘출발점’이 아닙니다. 출발점은 언제나 “무엇이 문제인가?”를 인식하는 데 있습니다. 이 문제의식을 갖지 못한 채 도구만 익히면 분석 결과는 단편적이고, 해석의 깊이가 떨어지며, 실무 적용도 어렵습니다.


현업에서 문제가 주어지지 않으면 분석은 무의미해지기 쉽습니다. 단지 ‘숫자 놀음’이 되거나, 혹은 ‘보고서용 시각화’에 불과한 결과가 나오기 때문입니다. 실제 현업에서 성공적인 데이터 분석 프로젝트는 대부분 다음과 같은 흐름을 따릅니다.


문제 정의 → 데이터 수집 → 전처리 → 분석 → 인사이트 도출 → 의사결정 → 밸류 창출


이 흐름에서 ‘문제 정의’가 빠지면 모든 분석 과정은 공허해집니다. 빅데이터 분석 프로젝트가 실패하는 이유는 바로 여기에 있습니다. 반대로 문제에서 출발한 분석은 강력한 통찰(insight)과 행동(action)으로 이어지며 조직에 실제적인 가치를 창출합니다.


문제 정의는 데이터 분석 프로젝트의 방향성을 결정합니다. 예를 들어 “최근 매출이 감소한 이유는 무엇인가?” 또는 “어떤 고객군이 이탈하고 있는가?” 같은 명확한 질문이 있어야, 어떤 데이터를 수집하고 어떤 분석을 해야 할지가 자연스럽게 결정됩니다. 이렇게 명확한 문제의식에서 출발한 분석만이 실질적인 전략 수립에 기여할 수 있습니다.


문제를 정의한다는 것은 단지 현상을 진단하는 것 이상입니다. 문제를 정의하는 순간, 우리는 데이터 분석의 방향뿐만 아니라 분석의 범위, 필요한 자원, 협업의 구조까지도 정하게 됩니다. 따라서 문제 정의는 단순한 시작이 아니라, 전체 분석의 성공을 좌우하는 ‘축’이라 할 수 있습니다.




센싱(Sensing)과 인사이트(Insight): 데이터를 읽는 힘


분석을 통해 원하는 것은 단순한 숫자가 아니라 ‘의미’입니다. 데이터를 통해 시장의 변화를 감지(sensing)하고, 그 변화의 본질을 꿰뚫어보는 능력, 그것이 인사이트(insight)입니다. 센싱은 주로 데이터의 변화, 이상, 패턴을 탐색하는 단계이며, 인사이트는 그 데이터를 통해 추론하고 해석하는 사고의 결과입니다.


예를 들어 주전자에서 수증기가 올라오는 것을 관찰한다고 생각해봅시다. 수증기는 ‘센싱’의 대상입니다. 시각, 청각 등 감각을 통해 현상의 징후를 감지합니다. 하지만 “물이 끓고 있다”는 통찰은 보이지 않는 내부의 본질을 꿰뚫는 인사이트입니다. 같은 현상을 보더라도 누군가는 그저 관찰하는 데 그치고, 누군가는 통찰로 나아갑니다.


데이터 분석도 마찬가지입니다. 수천 개의 숫자에서 패턴을 찾아내고, 그것이 의미하는 바를 해석할 수 있어야 진정한 분석이라고 할 수 있습니다. 이때 생성형 AI는 매우 강력한 도구가 됩니다. 분석 툴이 없던 시절에는 통계 패키지(SPSS 등)나 코딩 언어(Python, R 등)에 의존해야 했지만, 이제는 AI를 활용해 문제 정의부터 분석, 인사이트 도출까지 일련의 과정을 더 빠르고 정확하게 수행할 수 있습니다.


센싱과 인사이트는 결국 ‘해석력’과 연결됩니다. 데이터는 사실(fact)일 뿐이고, 이 사실을 어떻게 바라보고, 어떤 질문을 던지고, 어떤 결론으로 연결시킬 것인가가 바로 분석가의 통찰력입니다. AI는 이 과정에서 분석과 정리를 도와주는 강력한 조력자이지만, 핵심 통찰은 여전히 인간의 사고에서 출발합니다. 따라서 데이터 분석에서 중요한 것은 숫자 자체가 아니라, 그 숫자가 담고 있는 ‘맥락(context)’과 그것을 읽어내는 인간의 해석 능력입니다.



생성형 AI를 활용한 데이터 분석 프로세스


생성형 AI(특히 ChatGPT)를 활용해 어떻게 데이터를 분석할 수 있는지를 살펴볼까요. 분석 프로세스는 다음과 같이 구성됩니다.


1. 문제 정의: 해결하고자 하는 핵심 문제를 명확히 설정합니다.

2. 데이터 수집: 필요한 데이터를 내부 시스템, 외부 플랫폼, 설문 등을 통해 확보합니다.

3. 업로드: ChatGPT의 ‘데이터 어널리스트’ 기능을 활용해 데이터를 업로드합니다. (CSV 형식 권장)

4. 전처리: 이상치 제거, 결측치 보완, 불필요한 열 제거 등으로 데이터 정제를 수행합니다.

5. 탐색적 데이터 분석 (EDA): 기술통계 및 시각화로 데이터의 분포와 특징을 파악합니다.

6. 심화 분석: 상관 분석, 가설 검증, 텍스트 분석 등 목적에 맞는 분석을 진행합니다.

7. 인사이트 도출 및 리포트 작성: 분석 결과를 바탕으로 인사이트를 도출하고 의사결정에 반영합니다.


ChatGPT의 코드 인터프리터(Advanced Data Analysis) 기능을 활용하면, 이러한 전 과정을 대화형으로 진행할 수 있습니다. 분석 명령(프롬프트)을 자연어로 주고, AI가 자동으로 코드를 작성하고 결과를 시각화해줍니다. 분석 결과가 이상할 경우 AI가 직접 디버깅까지 수행해줍니다.


이러한 방식은 초보자에게 특히 유용합니다. 코딩을 모르는 사람도 자연어로 데이터 분석을 수행할 수 있기 때문입니다. 중요한 것은 명확한 문제의식과 함께 AI에게 어떤 분석을 요청해야 할지를 아는 ‘질문력’입니다. AI는 질문을 잘 던질수록 더 뛰어난 결과를 도출합니다. 따라서 프롬프트를 다듬는 기술, 문제를 쪼개고 구체화하는 능력이 앞으로 데이터 분석 실무자의 핵심 역량이 될 것입니다.



실무에 바로 쓰는 데이터 분석 예시


예를 들어, 사내 교육 과정 수강생 데이터를 기반으로 간단한 실습을 진행해 볼까요. 수강생 명단을 이미지 파일로 제공받아 스마트폰으로 촬영한 후, 이미지 인식 기능을 활용해 텍스트 테이블로 변환하고 CSV 파일로 저장했습니다.


수강생 명단 데이터 수집 및 전처리(실습용 가상데이터)




이를 ChatGPT에 업로드한 후 “이 데이터를 탐색해줘”라는 프롬프트만으로 데이터의 구조를 분석하고, 필요한 경우 헤더를 정리해주는 전처리 작업까지 자동으로 수행합니다. 이후 “근무 연수를 기준으로 기술통계 분석을 수행하고 히스토그램을 시각화해줘”라는 프롬프트로 분석을 완료할 수 있습니다.


챗GPT를 이용한 기술통계분석 결과(차트의 한글 깨짐 해결은 다음에 설명)



이 과정을 통해 우리는 다음과 같은 사실을 확인할 수 있습니다.

- 전체 수강생 중 근속 연수 20년 이상이 가장 많음

- 평균 근속 연수 18.4년으로 비교적 장기근속 조직임

- 분석 결과를 바탕으로 교육 커리큘럼을 어떻게 조정할지 인사이트 도출 가능


이처럼 생성형 AI를 활용한 데이터 분석은 단지 도구를 익히는 것이 아니라, 문제 정의 → 데이터 → 분석 → 의사결정이라는 흐름 전체를 경험하는 데에 의의가 있습니다. 그리고 이러한 흐름은 업무 현장에서 반복할수록 더 정교해지고 깊어집니다. 반복을 통해 분석 프로세스가 몸에 익고, 다양한 문제에 대한 분석 접근법이 확장되기 때문입니다.


AI는 도구일 뿐, 분석의 주체는 언제나 인간입니다. 중요한 것은 어떤 질문을 던지고, 어떤 데이터를 선택하고, 어떤 해석을 내릴 것인지에 대한 주도적 사고입니다. 기술은 보조수단이며, 본질적인 문제 해결력은 사람의 손에 달려 있습니다.



데이터 분석은 밸류 창출의 시작이다


데이터 분석은 도구나 기술보다 ‘생각하는 방식’에 가깝습니다. 단순히 분석 툴을 익히는 것이 아니라, 어떤 문제를 정의하고, 어떤 데이터를 통해 그것을 해결할 수 있을지 고민하는 사고의 훈련입니다.


‘문제 정의’의 중요성과 함께 전체 분석 프로세스를 생성형 AI를 통해 실습하는 구조를 살표보았습니다. 데이터 기반으로 문제를 감지하고, 의미를 파악하며, 행동으로 옮겨야만 진정한 밸류(Value)를 얻을 수 있습니다.


AI를 활용한 분석 시대에 더욱 중요한 것은 인간의 사고력과 질문력입니다. 기술이 아무리 발전해도 문제의식을 갖고 데이터에서 통찰을 발견하고 전략으로 연결하는 것은 사람의 몫입니다. 분석의 본질은 데이터를 해석하고 미래를 예측하며, 조직이 나아갈 방향을 결정하는 데 있습니다.

keyword
이전 01화생성형 AI와 함께 시작하는 데이터 마인드