brunch

GPT를 100% 쓰려면 반드시 알아야 하는 모델 특징

by SPECAL

아마 제 글을 보는 많은 분들은 인공지능에 관심이 있는 분들일 겁니다.


다만 O3보다는 O1이 유리한 질문이 있고 4O가 더 잘하는 일이 있다 이렇게 말씀드리면 뭔가 이상한가 줘


실제로 글쓰기를 할 때는 o3보다 잘 짜인 4o가 더 나은 성능을 보여줄 때가 많습니다. 이건 o3가 추론 코딩특화모델이라 그런 경향성이 강한데요 솔직히 말씀드리면 그냥 4.5를 쓰면 와 확실히 다르네 수준에 도달하지만 문제는 4.5가 제한이 있다는 겁니다.


그렇다면 이러한 제한된 상황에서 뭘 어떻게 해야 할까요? 한번 정리해 봅시다.

1.png


주요 모델만 정리하면 4o 4.5 o3-mini, o3-mini-high 정도입니다. o1-pro는 논외로 치겠습니다. 오늘 이야기할 건 4o o3 mini o1정도니까요 좀 더 이야기해 보죠


GPT-4o - 이메일, 기본 작성
GPT-4o - 일정예약- 메일 보고서 받기
GPT-4.5 - 아이디어 창조 글쓰기
GPT-o1 - 추론이 필요할 때 - 일반 작업메인
GPT o3-mini - 트렌드 예측 등 복잡한 시장분석
GPT o3-mini-high - 양질의 답변이 필요한 이과 작업에 사용 - 특히 코딩 특화

특징만을 뽑아낸 자료인데요, 그렇다면 어떤 식으로 사용해야 할까요?


이에 대해 논하기 위해서는 추론모델과 일반모델의 차이를 이해하셔야 합니다.


잘 알려져 있지만 4O, 4.5와 O1 O3는 추론모델과 비추론 모델의 차이입니다.

이론 적으로 접근하면 COT부터 출반 한 원리를 이야기해야 하지만 이런 복잡한 학술적인 용어는 치워두고 직관적인 단어로 reasoning, inference로 합니다.


음 그럼 추론모델이 무조건 더 좋은 거 아니에요? 문제는 이게 항상 좋은 게 아닙니다. 추론모델이 문제를 잘 풀고 코딩을 더 잘하는건 사실입니다만. 단순계산이나 단순 분석은 오히려 4O가 더 뛰어 날때가 많아요


직관적이지 않죠? 조금 예를 들어보죠

100X100

이문제를 푼다고 가정해 봅시다. 여기서 추론모델을 사용하는 건 오히려 손해입니다. 굳이 복잡하지 않은 문제를 해결하는데 전혀 문제가 없습니다. 물론 프롬프트를 이렇게 바꾸면 이야기가 달라지죠

100X100을 5가지 이상의 방식으로 풀어줘

문제는 정확히 공부하기 전까지는 이게 추론이 필요한 질문인지 아닌지 구분하기가 어렵다는 점일까요.


실제로 10000개의 데이터셋에서 비정형 데이터를 찾아내는 건 O1보다 4O가 더 빠릅니다. 자세히 설명드리면 비정형 데이터의 규칙을 지정하는 건 O1 그걸 처리하는 작업은 4O를 활용하는 것이죠


조금 실무적으로 가봅시다. 순수하게 메일을 쓰라고 해보죠 다음 프롬프트를 넣어봅시다.

2025년 3월 21일 날 열리는 'AI콘퍼런스'에 발표를 요청하는 메일을 보내려 합니다. 다음 조건에 따라 적절한 메일을 써주세요
#조건
-초청자명: 김승현
-연설주제: AI란 무엇인가
-발표시간: 30분
O1.PNG
17캡처.PNG

좌측이 O1우측이 4O로 지정된 녀석들입니다. 대충 무슨 말씀을 드리고 싶은지 아시겠나요?


일반적으로 명백한 단순글쓰기 조건문같이 들어간 녀석들은 4O의 영역이 훨씬 완성도가 높습니다. O1이나 O3는 자의적인 해석이 들어가는 경우가 있어요


그래서 순수한 메일작성은 4O를 추천드리는 거고요 유료결제자 분들에게는 4.5를 추천드립니다만

사실 4.5는 주당 100개 한정이라 O3로 구조화된 프롬트를 작성한 후 사용하시는걸 더추천드립니다.


자 이제 핵심을 정리해 보죠

매일쓰는기 4O
프롬프트작성 O3
글작업 O3기반으로 프롬프트를 짠 후 4.5
O3다쓰면 O1 이렇게 정리할 수 있겠네요






keyword
이전 06화AI 딥리서치는 어떤 방식으로 사용해야 하는가?