brunch

LLM, 소설, Bad

Llama 4 기반 소설 작성용 13B 이하 오픈소스 모델 현황

by AI러 이채문

� 현실적 상황

현재 Llama 4 기반의 소설 작성에 특화된 13B 이하 모델은 존재하지 않으며, 심지어 17B 모델들도 소설 작성에는 적합하지 않은 상태입니다.




1. Llama 4 공식 모델 현황

� 사용 가능한 모델들 (모두 17B 활성 파라미터)

Llama 4 Scout (17B 활성/109B 총)

컨텍스트: 10M 토큰 (업계 최대)

특징: 문서 요약, 대용량 코드베이스 분석에 특화

창작 성능: 기대에 미치지 못함


Llama 4 Maverick (17B 활성/400B 총)

컨텍스트: 1M 토큰

특징: 대화형 에이전트, 창작 파트너로 설계

창작 성능: 창작 글쓰기용으로 언급되나 실제 성능 부족




2. 소설 작성 성능 평가

� 전문가 리뷰 결과

매우 부정적인 평가


주요 문제점들

서사 일관성 부족: 스토리 전개의 논리적 흐름 결여

독창성 부족: 뻔하고 영감 없는 결과물 생성

구조적 일관성 결여: 전체적인 구성과 흐름 문제

반복적 출력: 같은 패턴의 지루한 반복

무질서한 구성: 체계적이지 못한 내용 구성


� 벤치마크 비교

DeepSeek: Llama 4보다 우수한 창작 성능

Gemini 2.5 Pro: 상당히 뛰어난 창작 능력

Claude 3.7 Sonnet: 높은 품질의 창작 지원

Llama 4: 간단한 광고 생성에서도 경쟁력 부족




3. 기술적 한계 분석

� 구조적 문제

MoE 아키텍처의 한계: 창작에 필요한 일관성 유지 어려움

멀티모달 우선: 텍스트 생성보다 시각적 작업에 최적화

조기 출시: 경쟁 압박으로 인한 성숙도 부족


� 실용적 한계

박스 아웃 성능: 파인튜닝 없이는 창작 작업 부적합

컨텍스트 활용: 10M 토큰도 서사 일관성으로 이어지지 않음

프롬프트 민감성: 적절한 결과를 얻기 위해 복잡한 프롬프팅 필요




4. 현재 이용 가능한 대안들

� 추천 모델 (비 Llama 4)

소설 작성에 적합한 기존 모델들

Claude 3.7 Sonnet: 뛰어난 창작 능력

DeepSeek-V3: 균형 잡힌 창작 성능

Gemini 2.5 Pro: 고품질 스토리텔링

GPT-4o: 안정적인 창작 지원


13B 이하 창작 특화 모델들

Llama 3.1 8B Instruct (파인튜닝 버전들)

Mistral 7B 기반 창작 모델들

Qwen 2.5 7B 창작 특화 버전들




5. 커뮤니티 파생 모델 현황

� 현재 상황 (2025년 5월)

공식 창작 특화 버전: 존재하지 않음

커뮤니티 파인튜닝: 아직 활발하지 않음

양자화 버전: 성능 향상 없이 크기만 축소


� 예상 발전 방향

단기 (2-3개월)

커뮤니티 창작 특화 파인튜닝 모델 등장 예상

Unsloth 등을 활용한 고속 파인튜닝 시도

특정 장르별 특화 모델 개발


중장기 (6개월+)

Meta의 Llama 4.1/4.2에서 창작 성능 개선

더 작은 크기의 창작 특화 모델 출시

커뮤니티 생태계 성숙화




6. 파인튜닝을 통한 해결 방안

�️ 현실적 접근법

Option 1: Llama 4 파인튜닝

# Unsloth를 활용한 창작 특화 파인튜닝 - 베이스: Llama 4 Scout (17B) - 데이터셋: 고품질 소설/창작 데이터 - 방법: LoRA/QLoRA 파인튜닝 - 예상 결과: 상당한 개선 가능

Option 2: 기존 모델 활용

# 검증된 13B 이하 창작 모델들 - Llama 3.1 8B + 창작 데이터셋 - Mistral 7B + 스토리텔링 파인튜닝 - Qwen 2.5 7B + 소설 특화 학습

� 파인튜닝 데이터셋 추천

공개 데이터셋: BookCorpus, OpenWebText

창작 특화: Creative Writing Prompts, Story Generation datasets

고품질 소설: Project Gutenberg, 공개 도메인 문학 작품




7. 실용적 권장사항

� 현재 최고의 선택

즉시 사용 가능

Claude 3.7 Sonnet: 최고 품질 창작 지원

DeepSeek-V3: 무료 + 고성능

Gemini 2.5 Pro: 다양한 창작 스타일


13B 이하 필요시

Llama 3.1 8B Instruct + 창작 프롬프팅

Mistral 7B Instruct + 스토리텔링 템플릿

커뮤니티 파인튜닝 모델 대기


� 프로 팁

하이브리드 접근: 큰 모델로 플롯 생성 → 작은 모델로 세부 작성

프롬프트 엔지니어링: Chain-of-Thought를 활용한 단계별 창작

후처리: AI 생성 후 인간의 편집과 개선


8. 미래 전망

� 기대 요소

Llama 4 Behemoth: 288B 활성 파라미터의 대형 모델

커뮤니티 혁신: 창작 특화 파인튜닝 기법 발전

하드웨어 발전: 더 큰 모델의 접근성 향상


⚠️ 현실적 조언

Llama 4는 현재 창작용으로 권장하지 않음

기존 검증된 모델들을 활용하는 것이 현명

파인튜닝 역량이 있다면 시도해볼 가치 있음




결론

Llama 4 기반의 소설 작성용 13B 이하 모델은 현재 존재하지 않으며, 17B 모델들조차 창작 작업에는 부적합한 상태입니다.

✅ 현재 최선의 대안

Claude 3.7 Sonnet: 최고 품질 (유료)

DeepSeek-V3: 무료 대안 중 최고

Llama 3.1 8B: 13B 이하 중 최선 (파인튜닝 필요)


� 장기적 해결책

커뮤니티 파인튜닝 모델 출시 대기

Meta의 차기 버전에서 창작 성능 개선 기대

개인/팀 차원의 창작 특화 파인튜닝 수행


소설 작성이 주 목적이라면 현재로서는 Llama 4보다는 다른 모델을 권장합니다.

keyword
작가의 이전글야누스 관련