NAVER CLOVA X Seed – 간단 테스트 후기

한국어 문제 생성에도 반가운 변화

by dean

그동안 한글 관련 AI 모델로 Gemma를 주로 사용해왔지만,

얼마 전 상업용 오픈소스로 공개된 CLOVA X Seed를 접하게 되었습니다.




CLOVA X 모델 소개


최근 NAVER에서 공개한 CLOVA X 모델은 최신 NLP 기술을 적용한 인공지능 언어모델로, 다음과 같은 세 가지 버전이 있습니다:


CLOVA X 0.5B

모델 특징: 0.5B(5억 파라미터) 버전은 가볍고 빠른 응답 속도를 자랑하여, 간단한 대화형 태스크에 적합합니다.

용도: 리소스가 제한된 환경이나 경량화된 응용 프로그램에 적합합니다.


CLOVA X 1.5B

모델 특징: 1.5B(15억 파라미터) 버전은 보다 많은 파라미터를 통해 복잡한 문맥 이해와 정교한 응답 생성을 지원합니다.

용도: 고급 대화, 복잡한 텍스트 생성, 다양한 지시 수행 등 정밀한 태스크에 적합합니다.


CLOVA X 3B

모델 특징 및 용도: 더 큰 파라미터 수로 제공되지만, 본 글에서는 LoRA 튜닝을 위한 기본 테스트 대상으로 주로 0.5B와 1.5B 버전을 살펴보았습니다.


image.png?type=w1


테스트 코드

carbon.png


a1.png
a2.png


최근 저는 CLOVA X 0.5B와 1.5B 버전을 사용하여 기본 한국어 테스트를 진행했습니다.


테스트 경험 및 느낀 점


테스트 환경: RTX 4090 GPU

테스트 방식: 빠른 프로토타이핑을 위해 Gradio 기반 인터페이스를 사용하였으며, 간단한 문답 형태의 테스트를 진행했습니다.

테스트 결과:

응답 속도: 전반적인 응답 속도는 괜찮았습니다.

한국어 자연스러움, Gemma보다 약간 느리더라도 “한국적”인 느낌의 자연스러운 한국어 문맥을 제공해주었습니다.


개선 가능성: 책의 내용을 캡쳐한 후 요청했을 때, 원하는 대답은 아니었지만 튜닝만 열심히 한다면 작은 GPU 서버에서도 충분히 상용 서비스로 운영할 수 있을 것이라는 가능성을 확인했습니다.


그동안 어색했었던 한국어 출력 문제로 고생했는데, 이번 CLOVA X Seed 모델은 그런 문제를 상당 부분 해소해 준다는 점에서 매우 반갑게 다가왔습니다.


다음 포스팅에는 튜닝을 통해 ClovaX Seed 을 제대로 활용해서 서비스화 시키는 과정을 포스팅해보겠습니다.


keyword
작가의 이전글아이들 퀴즈 놀이터 ‘상식왕’ #3