brunch

챗GPT를 이용한 데이터 전처리 실습(파워쿼리와 비교)

[AI 데이터 분석 EP07-2]

by 구자룡

P07-2. 챗GPT를 이용한 데이터 전처리 방법(파워 쿼리와 비교) : 실습


데이터 전처리와 그 방법에 대란 이해를 바탕으로 데이터 전처리 실습을 통해 직접 전처리를 해볼 수 있습니다. 챗GPT와 파워 쿼리를 이용하여 간단하게 전처리 어떻게 하는지 실습을 통해 설명해 드리겠습니다.


건강기능식품 매출액 공공 데이터 수집(원시 데이터)

챗GPT를 이용한 데이터 전처리 실습

파워 쿼리를 이용한 데이터 전처리 실습


https://youtu.be/QAjoaHKo-OM



챗GPT 데이터 분석 실습 데이터 공유: https://bit.ly/41zliec


프롬프트 : 데이터 분석


건강기능식품_매출액__국내_판매액_및_수출액_20250110112211.csv <업로드>


이 데이터는 건강기능식품의 품목별 5년간 판매량 데이터다. 탐색해줘.


품목별 매출액 (천 원) 이 들어간 행을 제거 해줘.


0 행을 제거해줘


"계" 행을 제거해줘.


품목별 (1)에서 품목별(단위 : 천원) 으로 변경해줘


탐색적 데이터 분석을 수행 해줘





챗GPT 내 Data Analyst 챗봇 사용시 주의사항


『AI 데이터 분석』에서 데이터 분석 실습은 주로 Open AI의 데이터 분석 전용 챗봇인 Data Analyst를 활용했습니다. 최근 이 기능에서 "분석중"이란 메시지가 나오지 않고 데이터 분석 방법에 대한 설명을 하거나 가이드만 제공해주면 여기서는 더 이상 데이터 분석이 안됩니다. 대신 분석을 위한 파이썬 코딩을 해줍니다. 즉 데이터 분석 실행을 하거나 라이브러리를 가상환경에 설치해 주지 못합니다.


(정확하게 언제부터 정책이 바뀐 것인지는 확인이 되지 않지만 2025년 1월 22일 확인한 결과, 이 변화는 OpenAI가 보안, 안정성, 리소스 제약 등 여러 이유로 인해 일부 실행 기능을 제한 했을 가능성이 높습니다.)


이런 경우에는 ChatGPT-4o에서 고급 데이터 분석(Advanced Data Analysis, ADA) 기능을 사용할 수 있기 때문에 동일한 사용 방법으로 데이터 분석을 수행하면 됩니다. 챗GPT Plus($20USD/월) 플랜에는 파일 업로드, 고급 데이터 분석 등의 기능을 사용할 수 있습니다.


챗GPT 내 Data Analyst 챗봇 사용시 주의사항.png


생성형 AI의 특성상 언제든지 정책이 바뀔 수 있기 때문에 사용 환경에 맞추어 적절하게 대응하면서 이용해야 합니다. 사용자의 주의가 요구됩니다.


결론적으로 ChatGPT-4o의 고급 데이터 분석(ADA) 기능을 이용하여 『AI 데이터 분석』에서 소개한 챗GPT를 이용한 데이터 분석은 정상적으로 수행 가능합니다.



<참고문헌>





keyword
매거진의 이전글챗GPT를 이용한 데이터 전처리 방법:파워 쿼리와 비교