brunch

You can make anything
by writing

C.S.Lewis

by 박경아 Jun 02. 2024

업그레이드된 GPT-4o로 데이터 분석하기

소셜 미디어 사용자 데이터 분석



GPT-4o가 출시되고 나서 몇 일 지나 데이터 분석 기능에도 업데이트 사항이 발표되었는데요.


데이터 분석과 관련해 주요 업데이트 사항인 인터랙티브 테이블과 차트로 데이터 분석과 시각화를 진행해 보았습니다.


분석에 사용된 데이터셋은 여행사의 소셜 미디어 사용자 행동 데이터인데요. 데이터셋을 분석하고 시각화하고 보고서 초안을 작성하는 것을 분석을 진행해 해보겠습니다.



데이터셋 업로드 및 인터렉티브 기능


기존에 컴퓨터에서 파일을 업로드하는 것도 가능하지만 이번 업데이트로 구글 드라이브나 마이크로소프트 원 드라이브와 연동하여 파일을 업로드하고 활용하는 게 가능해졌구요.


데이터셋에 대한 첫 질문으로 데이터셋을 설명해 달라고 했는데, 17개 컬럼을 가진 소셜 미디어 페이지의 사용자 행동 데이터라고 하네요. 업데이트된 인터랙티브 표 기능을 확인해 보고 싶어서 처음 몇 줄을 인터랙티브 표로 보여달라고 했습니다;


그랬더니 컬럼 선택이나 행 선택 등이 가능한 인터랙티브 표가 나와서 표를 확대했구요. 특정 컬럼을 선택해서 차이파트를 그려달라고 했더니 인터랙티브 차트가 그려졌습니다. 인터랙티브 차트는 색상 변경이나 바로 다운로드 하는 게 가능합니다. 



데이터 분석 주요 단계 진행


창을 축소하지 않고 계속 데이터 분석을 진행했는데요. 먼저 범주형 컬럼들의 기초통계를 확인해 달라고 했습니다. 그랬더니 각 범주형 컬럼들의 개수, 고유값의 개수, 최빈값 등을 확인해서 새로운 표로 보여주었는데요. 고유값에 어떤 값들이 있는 지 확인하고 싶어서 각 컬럼들의 고유값을 리스트에 담아 새로운 컬럼으로 추가해 달라고 했습니다 .


컬럼들의 고유값에 같은 의미인데 중복적인 값들이 있어 어떻게 하면 각 컬럼별 중복값들을 처리할 수 있을 지 물어봤구요. 


그랬더니 첫 번째 컬럼은 처리할 필요가 없다, 두 번째 컬럼은 대문자 소문자가 혼용되어 있어 소문자로 통일해서 처리하자 등등 의견을 제안해 주네요. 그래서 제안한 대로 데이터셋을 정제하고 업데이트된 기초통계표를 보여달라고 했는데요. 


다음 수치형 데이터 역시 기초통계를 표로 작성해 달라고 했구요. 수치형 데이터의 결측치 처리 방안을 각 컬럼 별로 제안해 달라고 하니까 범주형 컬럼까지 포함해서 제안을 해주네요.


결측치에 대해 평균값 혹은 중앙값 등을 활용해 어떻게 결측치를 처리할 수 있다고 컬럼별로 의견을 주는데요. 



데이터 시각화


데이터 기초통계를 확인하고 데이터셋을 정제한 후 역시 범주형과 수치형 데이터로 나눠 시각해 해봤는데요. 


범주형 데이터의 분포와 패턴을 잘 알 수 있게 시각화 해달라니까 컬럼별로 하나씩 인터랙티브 차트를 그려 주었습니다. 


표들을 그리드 스타일로도 나타내 달라고 했는데요. 그랬더니 그리드로도 잘 보여 주는데 이 경우 인터랙티브 차트가 아니여서 색상 변경은 불가능해요. 


수치형 컬럼 역시 그리드 스타일로 시각화했구요.



보고서 초안 작성


지금까지 작성한 내용을 정리해서 PPT로 작성해 달라고 했는데요. 몇 번이나 코드가 재작성 되더니 이제는 계속 분석중이라는 메시지가 뜨는데요. 몇 분 기다리다 링크를 새로고침했더니 다운로드 링크가 나와서 파일을 확인할 수 있었습니다.


ChatGPT가 작성해준 PPT 초안을 보면 분석한 내용이 장표별로 정리가 되어 있고 차트들도 하나 하나 장표에 들어가 있는데요. 그래서 총 슬라이드가 27개나 되네요. 


분석 목표에 따라 장표를 삭제할 껀 삭제하고 수정할 내용은 ChatGPT를 다시 활용해 수정할 수 있을텐데요. 마이크로소프트 오피스 365를 유료구독하시는 분들은 디자이너 기능을 활용해 디자인에 드는 시간도 훨씬 단축하실 수 있을 꺼예요.


지금까지 업그레이드된 GPT-4o의 기능을 활용해 데이터 분석을 하고 보고서 초안을 작성해 보았는데요. 좀 더 자세한 내용을 보고 싶으신 분들은 아래 영상을 참고해 주세요!




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari