(!) ChatGPT Plus 버전을 기준으로 합니다.
우리는 이미 멀티모달을 통해 ChatGPT가 이미지, 사운드 등의 다양한 데이터를 처리할 수 있다는 것을 알고 있습니다. 하지만 여기서 끝을 내기엔 여전히 부족하죠. 현장에서는 이미지나 사운드뿐만 아니라 엑셀, 로그 데이터와 같은 데이터의 생성 및 분석도 비일비재하게 일어나고 있기 때문입니다. 우리 회사의 마케팅 통계, 고객의 장바구니 분석, 사용자 로그 데이터 분석, 주가 및 그래프 분석, 더미 데이터 생성 등이 그 예시입니다.
ChatGPT 코드 인터프리터는 ChatGPT에서 사용할 수 있는 데이터 생성 및 분석 기능으로, ADA(Advanced Data Analysis)라고도 불리는데요, 이는 ChatGPT가 엑셀 혹은 소프트웨어에서 많이 사용하는 데이터 포맷인 XML, JSON, YAML과 같은 구조화된 데이터를 분석하고 생성하는 데이터 엔지니어링 작업에 사용됩니다.
그와 동시에 ChatGPT 코드 인터프리터는 AI 에이전트의 도구(Tools)라고도 볼 수 있습니다. 도구는 ChatGPT와 같은 AI 에이전트가 사용자의 문제를 해결하기 위해 사용할 수 있는 독립된 기능(함수)을 의미합니다. 코드 인터프리터는 사용자로부터 구조화된 데이터 파일 생성을 요구 및 분석을 요구받으면 내부적으로 파이썬(Python) 코드를 생성 및 실행합니다. 또한 코드 인터프리터는 보편적인 AI 에이전트 도구로 자리잡았기 때문에 ChatGPT 뿐만 아니라 다른 Gemini, Claude 등 다른 AI 서비스에도 탑재되어 있습니다.
인터프리터(Interpreter)
인터프리터는 컴퓨터 공학에서 코드 해석기를 의미합니다. 사람이 작성한 코드를 해석하고 분석하여 기계어와 자연어의 중간 단계인 바이트 코드(Bytecode)로 변환하고, 이를 실행합니다. 또한 인터프리터는 컴파일러와 다르게 코드를 통으로 처리하지 않고 한 줄씩 처리하여 파이썬(Python), 자바스크립트(Javascript)와 같은 스크립트 언어에 많이 사용됩니다. 반면 컴파일러는 일반적으로 C, C++, Go와 같은 언어에서 코드를 통으로 해석하여 .exe와 같이 운영체제가 실행할 수 있는 바이너리 파일(=실행 가능한 파일)을 만들어냅니다.
간단하게 코드 인터프리터를 사용하여 더미 데이터를 생성해 보도록 하겠습니다. 참고로 ChatGPT 코드 인터프리터는 기본적으로 활성화되어 있으므로 채팅창에서 바로 사용할 수 있습니다. 사용한 프롬프트는 다음과 같습니다.
당신은 더미데이터 생성기입니다.
# 지시
OpenAI가 상장 기업이라고 가정하고, 가상의 주가 정보를 [형식]에 맞추어 [파일]로 생성하세요.
파일= openai_stock_data.csv
# 형식
|Date|Open|High|Low|Close|Adj Close|Volume|
|-----|------|------|-----|------|----------|---------
코드 인터프리터가 파이썬 코드를 생성하고 실행하여 가상의 주가 데이터가 담긴 openai_stock_data.csv를 생성했습니다. 여기서 ChatGPT가 생성한 코드의 내용자체는 중요하지 않습니다. 중요한 것은 ChatGPT가 가상 데이터를 생성하기 위해 내부적으로 코드를 생성하고, 실제로 해당 코드를 실행하여 데이터를 작성했다는 것입니다.
이제 이 데이터를 분석하여 일봉 그래프 및 MA5(5일 이동평균선)을 그려보라고 지시하도록 하겠습니다. 코드 인터프리터는 데이터를 그저 분석할 뿐만 아니라 시각화를 위한 그래프를 그릴 수도 있다는 것에서, 이를 금융권과 같은 분야에서도 활용이 가능하다는 것을 알 수 있습니다. openai_stock_data.csv를 업로드하고 다음과 같이 지시해 보겠습니다.
당신은 금융데이터 분석가입니다.
첨부된 openai_stock_data.csv는 OpenAI가 상장되었다는 가정하에 작성된 가짜 주가 데이터입니다. 이를 토대로 일봉과 MA5 지표를 포함하여 캔들 차트로 나타내세요.
이제 다음과 같이 그래프가 생성되는 것을 것을 볼 수 있습니다. 그래프를 생성할 때도 마찬가지로 파이썬 코드를 생성하게 됩니다. 생성된 그래프를 보면, 지시대로 캔들 차트로 표현했고, 5일 이동평균선 및 거래량 지표도 나타나 있는 모습입니다. 더 나아가면 데이터를 분석하면 두 요소 간의 상관관계를 파악하여 새로운 인사이트를 얻는 등의 연구용으로도 사용하여 확장할 수 있습니다.
정리하자면, 우리는 ChatGPT에서 데이터를 생성하고 분석하기 위해 코드 인터프리터 기능을 사용할 수 있습니다. 코드 인터프리터는 ChatGPT와 같은 AI 에이전트가 사용자의 지시를 해결하기 위해 사용하는 도구(Tools)로, 사용자가 데이터를 생성하거나 분석을 요구하면 내부적으로 파이썬 코드를 생성하고 실행하는 기능입니다. 이러한 코드 인터프리터는 엑셀이나 XML, JSON, YAML과 같은 구조화된 데이터를 생성하고 분석할 수 있으며 통계 및 로그 데이터와 같은 정형화된 데이터를 분석할 때 유용합니다.
'비전공자를 위한 챗GPT 101'은 단순하게 챗GPT 사용법을 이야기하는 것이 아니라, 생성형 AI를 활용하기 위해 알아야 하는 기초를 대표적인 생성형 AI 서비스인 챗GPT를 사용하여 풀어냅니다. 물고기를 잡아주기보다는 물고기를 잡는 법을 알려줍니다.
챗GPT를 사용하는 활용법은 간단한 글쓰기부터 시작해서 기획, 마케팅 등 너무나도 많고, 직무마다 다른데, 이 글들은 '이메일 쓰기', '통계 분석하기 같은' 단순한 '사례'만을 이야기하지 않습니다. 생성형 AI의 '기본'을 이야기함으로써 챗GPT를 자유롭게 구사하며 실무에서 활용할 수 있도록 뼈대를 쌓습니다.