chatGPT 고급 기능 정리
이번 〈매체를 넘는 생각〉 연재에서는
사람들이 아직 “좋은 프롬프트”에 몰입해 있는 사이,
ChatGPT 생태계가 얼마나 멀리 가버렸는지를 짚어 본다.
2025년 현재, 프롬프트는 입구일 뿐—
진짜 재미는 그 뒤에 숨은 고급 기능을 엮어 새로운 ‘매체’를 만들어 내는 과정에 있다.
1. 멀티모달 시대
• GPT-4o(Omni)는 텍스트·이미지·음성 입력을 한 화면에서 다루며, 속도·추론력이 GPT-4 대비 체감 차이를 보인다.
• GPT-4.5(연구 프리뷰)는 더 넓은 지식베이스와 ‘EQ’까지 강화해 창작·코딩·논증에서 오차를 줄였다.
활용 팁
1. 소재 수집: 사진을 올려 “이 장면에 맞는 에세이 오프닝 3가지” 요청
2. 즉석 더빙: 음성 모드에서 “이번 문단을 편집해 달라”라고 말하며 녹음 → 바로 수정본 확인
2. Custom GPTs — 나만의 AI 만들기
이제 GPT 제작 화면에서 GPT-4o, o3, o4-mini 등 원하는 모델을 고르고,
지침·파일·툴을 붙여 “맞춤 에디터”나 “시장조사 봇”을 클릭 몇 번으로 완성할 수 있다.
*2025-06 기준 ‘GPT 제작 화면(� Create a GPT)’의 전체 워크플로와 세부 옵션을 한 번에 정리한 것이다. UI는 소폭 바뀔 수 있으니, 메뉴 이름이 달라도 위치·기능은 동일하다.
ChatGPT 좌측 사이드바 → Explore GPTs → [Create] 클릭
“대화형” 마법사(초기 대화)로 간단히 콘셉트를 잡거나, 곧바로 [Configure] 탭으로 이동해 세밀 설정
모델 선택
지침 (Instructions) — 성격과 말투를 정의
• 시스템 지침: GPT의 “본체” — 톤·금기·대상 독자
• 예시 대화: 입력 → 응답 페어로 학습시키는 few-shot
• 고급 설정: temperature·top_p·max_tokens 등 파라미터
사례)
당신은 ‘연재 원고 맞춤 에디터’입니다.
오탈자·문맥 오류만 교정하고, 2) 문체는 사용자의 원문 톤(잔잔한 1인칭)을 유지, 3) 2000자 이상 삭제 금지.
지식 (Knowledge) — 파일 업로드
• PDF·TXT·DOCX·CSV 등 최대 20개 / 총 100 MB 업로드 가능
• 검색·인용은 GPT가 자동 처리 (URL 기반이 아님)
• 파일 교체 시 자동 재인덱싱(몇 분 소요) 후 새 버전 적용
예: “시장조사 GPT”에 24 Q4 PDF 보고서 10종 업로드 → 즉시 질의 가능
• Plus 이상 플랜은 비밀 유지(NDA) 옵션으로 내부 자료 보호 가능
툴 (Tools) — 토글만 켜면 끝
복수 툴을 동시에 켜면, GPT가 대화 흐름에 맞춰 알아서 호출
Actions — 외부 API 연동 (선택)
“GPT가 캘린더 일정을 직접 추가”처럼 실제 작업을 시키려면?
1. Add action → New
2. OpenAPI 3.1 스키마 붙여 넣기
3. (필요시) OAuth · API Key 등 인증 정보 입력
4. 저장 → 프롬프트에서 자연어로 호출 가능
paths:
/events:
post:
operationId: createEvent
summary: "Google Calendar 일정 생성"
requestBody:
...
responses:
"200": …
테스트 대화 예:
“다음 주 화요일 오후 3시에 ‘팀 회의’ 일정 잡아줘” → 캘린더 API 호출 → “일정이 등록되었습니다.”
배포 옵션 (Share & Publish)
1. Only me – 개인용
2. Anyone with link – 비공개 링크 공유
3. Workspace – Team/Enterprise 조직 내부
4. GPT Store – 검수 후 전 세계 공개, 수익 배분 가능
버전 업데이트 시 자동 패치, 사용자는 새 버전을 즉시 사용.
아이디어
• ‘시리즈 아카이브 GPT’: 과거 연재 원고를 통째로 업로드 → 한 줄 키워드만 주면 연재 흐름에 맞춰 시놉시스 자동 제안
요금·성능 팁
• 토큰 청구: GPT 이용자는 선택 모델 기준으로 소비(빌더=소유자·사용자 모두 동일 단가)
• Free 사용자도 ‘GPT Store’ 공개 버전은 쓸 수 있지만, 모델은 o4-mini로 자동 다운그레이드
• 속도 최적화:
• ① Instruction 간결화 → ② o3로 먼저 테스트 → ③ 결과 품질 부족할 때 4o로 승격
• 비용 절감: 대량 작업 GPT는 max_tokens 제한·답변 길이 요구 조건화
대표 시나리오
3. 메모리 — ‘대화’에서 ‘관계’로
4월 업데이트 이후 ChatGPT는 모든 과거 대화를 스스로 참조한다.
설정에서 켜고 끌 수 있으며, Plus/Pro는 더 긴 기억을 갖는다.
창작 활용
• 캐릭터 설정·톤·장르 선호를 기억시켜 두면 매 회차 브리핑을 생략해도 동일한 문체·세계관을 유지.
4. Advanced Voice Mode 2.0
6월 업그레이드로 억양·감정 표현이 자연스러워졌고,
실시간 통역도 지원한다.
여행 인터뷰를 준비 중이라면 휴대폰만으로 현장 통역 + 녹취본 생성이 가능하다.
Advanced Voice Mode 2.0을 쓰려면?
5. GPT-Image-1 — 텍스트를 넘어 그림까지
4월 공개된 gpt-image-1은 DALL·E 3을 잇는 최신 이미지 모델로,
파트너 앱(Adobe Express·Figma 등)에 탑재되어 세밀한 스타일·텍스트 렌더링까지 지원한다.
활용 예
• 연재 커버를 “빈 책상 위 펜과 커피, 글자들이 공중으로 흩어지는 수묵화”처럼 묘사해 바로 생성
• 이미지→글 반전: 사진을 넣고 “이 장면을 200자 산문으로” 요청
6. Deep Research & Connectors
Deep Research 모드가 기업용·프로 플랜에 확대되며,
Google Drive·Notion·GitHub 등 커넥터로 서비스에 생성해 둔 자료까지 자동 인용·요약해 준다.
7. Scheduled Tasks — AI가 먼저 다가오는 순간
“매일 오후 3시에 AI 뉴스 브리핑”,
“매주 월·목 밤 10시에 글쓰기 리마인더”처럼 작업 예약을 하면
ChatGPT가 지정 시간에 먼저 메시지를 보낸다.
8. 실전 체크리스트
매체를 뛰어넘는 사고법
프롬프트는 여전히 중요하지만,
2025년형 ChatGPT는 입력·출력·맥락·시간까지 포괄하며 스스로 ‘미디어’가 되었다.
글, 그림, 음성, 일정 관리가 한 생태계 안에서 상호 변환될 때,
우리는 “글쓰기”를 넘어서 “경험 디자인”을 하게 된다.