[AI 데이터 분석 EP07-2]
P07-2. 챗GPT를 이용한 데이터 전처리 방법(파워 쿼리와 비교) : 실습
데이터 전처리와 그 방법에 대란 이해를 바탕으로 데이터 전처리 실습을 통해 직접 전처리를 해볼 수 있습니다. 챗GPT와 파워 쿼리를 이용하여 간단하게 전처리 어떻게 하는지 실습을 통해 설명해 드리겠습니다.
건강기능식품 매출액 공공 데이터 수집(원시 데이터)
챗GPT를 이용한 데이터 전처리 실습
파워 쿼리를 이용한 데이터 전처리 실습
챗GPT 데이터 분석 실습 데이터 공유: https://bit.ly/41zliec
프롬프트 : 데이터 분석
건강기능식품_매출액__국내_판매액_및_수출액_20250110112211.csv <업로드>
이 데이터는 건강기능식품의 품목별 5년간 판매량 데이터다. 탐색해줘.
품목별 매출액 (천 원) 이 들어간 행을 제거 해줘.
0 행을 제거해줘
"계" 행을 제거해줘.
품목별 (1)에서 품목별(단위 : 천원) 으로 변경해줘
탐색적 데이터 분석을 수행 해줘
『AI 데이터 분석』에서 데이터 분석 실습은 주로 Open AI의 데이터 분석 전용 챗봇인 Data Analyst를 활용했습니다. 최근 이 기능에서 "분석중"이란 메시지가 나오지 않고 데이터 분석 방법에 대한 설명을 하거나 가이드만 제공해주면 여기서는 더 이상 데이터 분석이 안됩니다. 대신 분석을 위한 파이썬 코딩을 해줍니다. 즉 데이터 분석 실행을 하거나 라이브러리를 가상환경에 설치해 주지 못합니다.
(정확하게 언제부터 정책이 바뀐 것인지는 확인이 되지 않지만 2025년 1월 22일 확인한 결과, 이 변화는 OpenAI가 보안, 안정성, 리소스 제약 등 여러 이유로 인해 일부 실행 기능을 제한 했을 가능성이 높습니다.)
이런 경우에는 ChatGPT-4o에서 고급 데이터 분석(Advanced Data Analysis, ADA) 기능을 사용할 수 있기 때문에 동일한 사용 방법으로 데이터 분석을 수행하면 됩니다. 챗GPT Plus($20USD/월) 플랜에는 파일 업로드, 고급 데이터 분석 등의 기능을 사용할 수 있습니다.
생성형 AI의 특성상 언제든지 정책이 바뀔 수 있기 때문에 사용 환경에 맞추어 적절하게 대응하면서 이용해야 합니다. 사용자의 주의가 요구됩니다.
결론적으로 ChatGPT-4o의 고급 데이터 분석(ADA) 기능을 이용하여 『AI 데이터 분석』에서 소개한 챗GPT를 이용한 데이터 분석은 정상적으로 수행 가능합니다.