brunch

You can make anything
by writing

C.S.Lewis

실무에서 바로 써먹는 챗GPT 데이터 분석

ChatGPT의  ADA(Advanced Data Analysis) 활용



콘텐츠 목차  

챗GPT 강점 - 데이터분석

데이터 분석? 들어보긴 했는데…

데이터 분석 진행하기
1. 데이터 업로드 및 인지시키기
2. EDA(Exploratory Data Analysis) 진행하기
3. 상관관계 분석을 통한 인사이트 발견
4. 추가 가설 생성 및 검증
5. 보고서 작성하기

주의사항

챗GPT와 함께라면 누구나 할 수 있는 데이터 분석






이 블로그 포스트에서 제공하는 실습 자료를 활용하여 여러분도 직접 챗GPT를 통한 데이터 분석을 경험해보시길 바랍니다. 아래 버튼을 눌러 필요한 자료를 다운로드하세요.

데이터 분석 실습 자료 다운로드 






챗GPT의 강점 - 데이터 분석

요즘 인공지능계에서 가장 화두가 되고 있는 챗GPT, 들어보셨죠? 지난번에 말씀드렸던 것처럼 챗GPT, Claude, Gemini 등이 현재 가장 대표적인 LLM 서비스입니다. 


그 중에서도 챗GPT만의 독보적인 기능이 있는데, 바로 ADA(Advanced Data Analysis)입니다. 이 기능 덕분에 파이썬 코드를 짜서 챗GPT 대화창에서 바로 실행하고 결과까지 확인할 수 있죠. 오류가 나도 알아서 디버깅해주니 파이썬 코드를 활용하는 일이 훨씬 쉬워졌습니다. 


ADA 기능 덕에 이제 데이터 분석도 훨씬 접근성이 좋아졌는데요. 오늘은 바로 이 챗GPT의 ADA 기능을 활용해서 데이터 분석을 해보는 방법을 소개해드리려고 합니다. 


먼저 데이터 분석이 정확히 뭔지 짚어보고, 데이터 분석 초보자들이 겪을 수 있는 어려움도 살펴볼게요. 그 다음엔 실제로 챗GPT로 데이터를 분석하고, 그 결과로 의미있는 보고서까지 작성하는 과정을 함께 체험해보겠습니다. 준비 되셨나요? 그럼 시작해봅시다! 






데이터 분석? 들어보긴 했는데...

데이터 분석이란 비즈니스에 도움 되는 정보를 얻기 위해 데이터를 모으고, 가공하고, 분석하는 일련의 과정을 말해요. 데이터에 감춰진 패턴이나 인사이트를 찾아냄으로써 현상을 이해하고 미래를 예측할 수 있게 되죠. 빅데이터와 인공지능 기술이 발전하면서 요즘 들어 데이터 분석의 중요성은 나날이 커지고 있습니다.


하지만 데이터 분석에 대해 들어만 봤지 어떻게 시작해야 할 지 막막한 분들이 많죠. 데이터는 어떻게 모으고 어떻게 분석해야 하는 걸까요? 통계랑 프로그래밍을 잘 모른다면 데이터 분석은 너무 어려운 게 아닐까요? 이런 고민 때문에 데이터 분석에 쉽게 도전하지 못하시는 분들이 꽤 있습니다.


그런데 여러분, 챗GPT만 있다면 걱정 붙들어 매셔도 됩니다! 이제 챗GPT가 함께라면 누구나 데이터 분석에 도전해볼 수 있게 됐거든요. 전문 지식이 부족해도 챗GPT가 여러분을 든든하게 서포트해줄 테니까요. 



데이터 분석, 어떻게 할까?

챗GPT로 데이터 분석을 하려면 어떤 과정을 거쳐야 할까요? 오늘 다룰 데이터 분석 예시는 아래와 같은 순서로 진행됩니다.  


챗GPT에게 분석할 데이터를 주고 이를 인식시킵니다.

EDA(Exploratory Data Analysis), 즉 탐색적 데이터 분석을 수행합니다.

관심있는 특정 '변수'를 정하고, 이를 기준으로 다른 모든 변수들과의 상관관계를 분석합니다.

분석 결과를 토대로 가설을 세우고 검증합니다.

마지막으로 분석 내용을 종합하여 보고서를 작성합니다.


챗GPT를 활용하면 사람이 직접 분석하는 것보다 훨씬 거시적인 관점에서 데이터 분석을 진행할 수 있어요.  

탐색적 데이터 분석(EDA)을 통해 여러 각도에서 데이터의 구조를 살펴보고 간단한 인사이트를 얻을 수 있습니다.

우리가 주목하고 싶은 특정 변수를 챗GPT에게 알려주면, 그 변수와 연관된 다른 모든 변수들의 상관관계를 신속 정확하게 분석해 줍니다.


이런 작업들은 사람이 하기에는 지루하고 오래 걸리지만, 인공지능에게는 식은 죽 먹기랍니다. 이렇게 데이터를 분석하면 전체적이고 입체적인 관점을 가질 수 있고, 현실성 있는 가설을 세우는 데 큰 도움이 됩니다.

챗GPT를 활용하면 더 꼼꼼한 데이터 분석을 '쉽게' 할 수 있어요


물론 실제 데이터 분석 프로젝트를 할 때는 상황에 맞게 분석 절차를 구체적으로 정의하고 필요하면 유연하게 조정해야겠죠. 이 부분은 실무자 여러분의 역량이 필요한 영역이에요. 오늘은 챗GPT로 데이터 분석을 하는 전반적인 흐름을 알아보는 데 초점을 맞추겠습니다. 


자, 그럼 실제 데이터로 한번 분석을 해볼까요? 케글의 IMB HR 데이터를 가지고 직원들의 '성과 평가' 점수에 영향을 미치는 요인들을 살펴보고, 개선 방안까지 모색해 보겠습니다. 챗GPT와 함께 떠나는 흥미진진한 데이터 분석 여행, 지금 출발합니다!  


1. 데이터 업로드 및 인식시키기

데이터 분석의 첫 걸음은 챗GPT에게 분석할 데이터를 전달하고 인식시키는 것입니다. 데이터 파일을 올린 후 바로 분석 작업을 시키면 편하겠지만, 단계를 나누어 진행하는 게 더 나은 결과를 기대할 수 있어요. 한 번에 너무 많은 작업을 요구하면 챗GPT가 각 단계에 집중하지 못하고 대충 처리해 버릴 수 있거든요.


우선은 데이터에 어떤 열(column)이 있고, 어떻게 구성되어 있는지 살펴보고 요약해 달라고 요청하세요. 이렇게 데이터의 구조와 특성을 파악하는 과정이 이후 분석에 큰 도움이 된답니다.

데이터 분석 1단계 - 데이터 인식시키기


2. EDA(Exploratory Data Analysis) 수행하기

EDA, 즉 탐색적 데이터 분석은 본격적인 분석에 앞서 데이터를 여러 각도에서 살펴보는 과정입니다. 이를 통해 데이터의 특징과 패턴을 파악하고, 이상치나 특이점 등을 발견할 수 있죠. 변수들 사이의 관계를 살펴보는 것도 EDA의 중요한 목적 중 하나예요.

EDA는 크게 4가지 방식으로 진행할 수 있습니다.  

일변량 비시각화 기법(Uni-variate Non-Graphical)

일변량 시각화 기법(Uni-variate Graphical)

다변량 비시각화 기법(Multi-variate Non-Graphical)

다변량 시각화 기법(Multi-variate Graphical)


일변량 분석은 개별 변수의 특성을, 다변량 분석은 여러 변수 간의 관계를 살펴보는 거예요. 그리고 시각화를 활용하면 데이터의 특징을 더욱 직관적으로 파악할 수 있죠. 

데이터 분석 2단계 - EDA(Exploratory Data Analysis) 수행 - 일변량 비시각화



데이터 분석 2단계 - EDA(Exploratory Data Analysis) 수행 - 일변량 시각화




여러분, 데이터 분석에 대해 더 궁금하신가요?

아래 링크를 클릭해서 콘텐츠 원문을 끝까지 읽고 데이터 분석 실무 활용 방법을 터득할 수 있어요!

[누구나 따라할 수 있는 챗GPT 데이터분석] 


전문 지식이 없어도 괜찮아요. 챗GPT가 여러분을 도와줄 거예요!

이번 포스트에서는 챗GPT로 데이터 분석을 하는 과정을 따라가 보겠습니다. 데이터 업로드부터 탐색적 데이터 분석(EDA)까지, 데이터 분석의 첫걸음을 함께 내딛어 볼까요?


챗GPT와 함께라면 어렵게만 느껴졌던 데이터 분석도 결코 두렵지 않습니다.

지금 바로 도전해보세요! 



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari