실무 밀착 시나리오
테스트 프롬프트
결과: 둘 다 ALL PASS
31B 응답
E4B 응답
분석: 둘 다 노이즈를 완벽히 필터링하고 핵심 추출.
31B가 더 깔끔한 포맷,
E4B가 더 상세한 비고.
테스트 프롬프트
결과: 둘 다 ALL PASS
31B 응답
E4B 응답
분석:
31B가 더 프로페셔널한 CS 톤.
E4B는 이모지가 포함되어 CS용으로는 부적합할 수 있음.
31B 소폭 우세.
테스트 프롬프트
결과: 둘 다 ALL PASS — 15만원, 식권앱 정확 답변
테스트 프롬프트
결과: 둘 다 ALL PASS
31B 응답
E4B 응답
분석:
31B 우세. 2가지 상황별 Slack 옵션 + 기획자용 추가 설명까지 제공. E4B도 충분히 좋지만 깊이에서 차이.
테스트 프롬프트
결과: 둘 다 ALL PASS
31B: 2가지 버전(표준형/부드러운형) + 작성 팁 제공 E4B: 1가지 버전 + 작성 팁 제공
31B 소폭 우세 — 옵션 제공의 depth.
테스트 프롬프트
결과: 둘 다 ALL PASS
31B 응답 (요약)
E4B 응답 (요약)
분석: 31B 우세.
위험도 분석 + **구체적인 협상 방향(개선 제안)**까지 제시.
E4B는 이유까지만 분석. 실무에서는 31B 답변이 즉시 활용 가능.
테스트 프롬프트
31B 우세.
31B는 dict.fromkeys() + O(n²)→O(n) 성능 분석까지 정확히 짚었고,
E4B는 성능 관련 부분에서 자동검증에 실패.