[2부] Gemma4 31B vs E4B(8B)

실무 밀착 시나리오

by dean
image.png


4. 실무 밀착 시나리오


4.1 STT 회의록 복원 (노이즈 데이터 → 액션 아이템)


테스트 프롬프트

image.png

결과: 둘 다 ALL PASS

31B 응답


image.png


E4B 응답

image.png


분석: 둘 다 노이즈를 완벽히 필터링하고 핵심 추출.

31B가 더 깔끔한 포맷,

E4B가 더 상세한 비고.


4.2 분노 고객 CS 방어 (금지어: 과실/배상, 200자 이내)

테스트 프롬프트


image.png

결과: 둘 다 ALL PASS


31B 응답


image.png


E4B 응답


image.png


분석:

31B가 더 프로페셔널한 CS 톤.

E4B는 이모지가 포함되어 CS용으로는 부적합할 수 있음.


31B 소폭 우세.

4.3 모순된 RAG — 시점 추론 (규정 변경 전/후 구분)

테스트 프롬프트


image.png


결과: 둘 다 ALL PASS — 15만원, 식권앱 정확 답변

4.4 레거시 에러 로그 해석 (비개발자 번역 + Slack 메시지)


테스트 프롬프트


image.png

결과: 둘 다 ALL PASS

31B 응답


image.png

E4B 응답


image.png

분석:


31B 우세. 2가지 상황별 Slack 옵션 + 기획자용 추가 설명까지 제공. E4B도 충분히 좋지만 깊이에서 차이.

5.1 후속 비즈니스 이메일

테스트 프롬프트


image.png

결과: 둘 다 ALL PASS

31B: 2가지 버전(표준형/부드러운형) + 작성 팁 제공 E4B: 1가지 버전 + 작성 팁 제공

31B 소폭 우세 — 옵션 제공의 depth.

5.2 계약서 위험 조항 분석

테스트 프롬프트


image.png


결과: 둘 다 ALL PASS

31B 응답 (요약)


image.png

E4B 응답 (요약)


image.png

분석: 31B 우세.

위험도 분석 + **구체적인 협상 방향(개선 제안)**까지 제시.

E4B는 이유까지만 분석. 실무에서는 31B 답변이 즉시 활용 가능.

5.3 코드 리뷰 + 버그 찾기

테스트 프롬프트


image.png



image.png


31B 우세.

31B는 dict.fromkeys() + O(n²)→O(n) 성능 분석까지 정확히 짚었고,

E4B는 성능 관련 부분에서 자동검증에 실패.

매거진의 이전글[1부] Gemma4 31B vs E4B(8B)