카피일까, 창조일까?

논란의 중심에 선 업스테이지

by 야옹이

최근 한국 AI 업계가 조금 시끄럽습니다.


국가대표AI로 선발된 업스테이지(Upstage)의 최신 모델, 'Solar-Open-100B' 때문입니다.


이야기의 핵심은 꽤 자극적입니다. "한국 국가대표 AI가 사실은 중국 모델을 베낀 것 아니냐?" 라는 의혹이 제기되었거든요.


기술적인 이야기라 머리 아프게 들릴 수 있지만, 사실 들여다보면 우리네 '집 짓기'나 '요리'와 아주 비슷한 이야기입니다.

오늘은 감정을 걷어내고, 이 논란이 우리에게 던지는 진짜 질문이 무엇인지 차분하게 짚어보려 합니다.


"쌍둥이 같아요" vs "내 자식 맞습니다"


사건의 발단은 이렇습니다. 한 AI 분석 기업이 업스테이지의 새 모델을 뜯어보니, 중국의 유명 AI 모델(GLM-4.5)과 구조가 너무 똑같다는 분석을 내놓았습니다. 수치로 따지면 유사도가 96%가 넘는다는 거죠. "이건 남의 모델을 가져와서 껍데기만 살짝 바꾼 것 아니냐"는 의심이 생길 법합니다.

이에 대해 업스테이지는 억울함을 호소하며 "육아 일기"를 공개했습니다.


"무슨 소리냐, 우리는 백지상태에서 시작했다. 처음엔 아무것도 모르는 갓난아기 상태(랜덤 초기화)에서, 우리가 직접 구한 데이터로 3개월 동안 밤낮없이 가르쳐 키운 모델이다."


업스테이지는 학습 과정이 담긴 기록(로그)과 성적표를 증거로 내밀었습니다.

즉, "남의 집 아이를 데려온 게 아니라, 남의 집 아이랑 비슷하게 생겼을진 몰라도 내 밥 먹여서 내가 키운 내 자식이다"라는 주장입니다.



'원천 모델'이란 무엇일까요?


여기서 의견이 갈립니다.

"어디까지 직접 해야 '진짜 내 것(원천 모델)'이라고 부를 수 있을까?" 라는 기준 때문입니다.


집 짓기에 비유해 볼까요?

기준 A (엄격함): "설계도 직접 그리고, 벽돌도 직접 굽고, 집도 직접 지어야지!"

기준 B (현실적): "설계도는 잘 지어진 남의 집(오픈소스)을 참고하고, 대신 벽돌 쌓고 시멘트 바르는 건 처음부터 내가 다 했어!"

지금 업스테이지는 기준 B에 가깝습니다. 중국 모델이나 유명한 모델들의 훌륭한 '설계도(아키텍처)'를 참고했을 가능성은 높지만, 그 안에 들어가는 지식과 경험(가중치)은 처음부터 직접 돈과 시간을 들여 쌓아 올렸다는 것이죠.


사실 전 세계 대부분의 AI 기업들도 '기준 A'를 완벽히 지키긴 어렵습니다. 대부분 구글이나 메타가 만든 훌륭한 설계 방식을 따르거든요. 그런 면에서 "업스테이지는 원천 기술이 아예 없다"라고 비난하는 건 조금 가혹할 수 있습니다.


'Fast follower'의 딜레마

하지만 이번 논란이 유독 뜨거운 이유는 따로 있습니다. 바로 이 프로젝트가 '국가대표 AI 만들기'라는 타이틀을 달고 있기 때문입니다.


우리는 예전부터 '빠른 추격자' 전략에 능했습니다. 남들이 만든 자동차, 반도체 설계를 빠르게 흡수해서 더 싸고 좋게 만드는 것, 그게 한국의 저력이었죠. 업스테이지도 그런 면에서 '엔지니어링(기술 구현)' 능력은 탁월합니다. 검증된 설계도를 가져와 한국어 데이터를 빵빵하게 채워 넣고 성능을 끌어올리는 능력 말이죠.


하지만 국민들은 기대합니다.

"세금이 들어간 국가 프로젝트라면, 설계도부터 우리 것이어야 하지 않을까?"


중국 모델의 설계도를 가져다 썼다면, 나중에 기술 독립을 외칠 때 족쇄가 될 수도 있으니까요.

"기술적으로 효율적인 선택"과 "국가적 자존심 및 독립성" 사이에서 딜레마가 생긴 겁니다.


이제는 '솔직한 실력'을 보여줄 때

결국 이번 사건은 한국 AI가 성장하면서 겪는 성장통입니다.

업스테이지가 "우리는 100% 창조했다"라고 완벽함을 강조하기보다, "세계적으로 검증된 설계를 바탕으로, 한국적인 맥락과 데이터를 처음부터 학습시켜 우리만의 집을 지었다"라고 더 투명하게 소통했다면 어땠을까요? 그랬다면 '표절' 논란보다는 '영리한 전략'이라는 평가를 받았을지도 모릅니다.


우리는 여전히 한국형 AI를 응원합니다. 구글과 오픈AI가 지배하는 세상에서, 우리말과 우리 문화를 가장 잘 이해하는 AI 하나쯤은 꼭 필요하니까요.


다만, 이제는 '최고', '최초'라는 수식어보다 투명한 과정과 솔직한 기술력으로 신뢰를 쌓아야 할 때입니다. 비 온 뒤에 땅이 굳듯이, 이번 논란을 계기로 우리 AI 생태계가 한 층 더 성숙해지기를, 읽어주신 분들께서도 함께 지켜봐 주시면 좋겠습니다.



"남의 설계도를 참고해 내 벽돌로 지은 집. '불법 건축물'은 아니지만,
'순수 창작 건축상'을 받기엔 조금 애매한... 지금은 딱 그런 상황 아닐까요?"



*최대한 이해하기 쉬운 비유를 사용하다 보니 일부 개념에서 엄밀하지 못한 부분이 있을 수 도 있습니다.

keyword