LG, 네이버와는 다른 독자 노선
KT가 자체 LLM을 공개하며 AI 사업에 자신감을 드러내고 있다. 지난 7월 4일 공개된 ‘믿:음 2.0’은 한국어 평가 플랫폼 ‘호랑이 리더보드3’에서 150억 파라미터 미만 국내 모델 중 종합 1위를 기록했다. KT가 ‘소버린 AI’라는 개념과는 다소 상이한 ‘한국적 AI’를 강조한 결과이다.
KT AI Future Lab 배순민 상무는 ‘한국적 AI’를 단순히 한국어를 잘 처리하는 기술로 보지 않는다고 설명했다. 배 상무는 한국 문학, 역사, 철학으로 이어지는 ‘문사철’의 맥락을 이해하고 학습한 AI야말로 진정한 한국적 AI라고 강조한다. 누가 만들었느냐보다, 그 기술이 한국인의 언어와 정서, 사고방식 안에서 자연스럽게 작동하느냐가 더 중요하다는 의미이다.
KT의 AI 전략은 세 가지 방향으로 나뉜다고 한다. (1) 한국 언어와 문화 특성을 반영한 자체 LLM 개발, (2) 전국 13개 데이터센터를 기반으로 한 클라우드 및 비정형 데이터 처리 인프라 구축, (3) 기술 신뢰를 뒷받침할 수 있는 윤리적 설계와 보완 체계다. 베 상무는 이 세 개가 함께 작동할 때만 유의미힌 AI 접근이 가능하다고 강조한다.
(1) KT는 고려대 민족문화연구원과 협력해 고전 문헌, 역사 자료, 철학 개념을 AI가 학습할 수 있도록 정제해왔다고 한다. 단순히 한글 데이터를 많이 넣는 것이 아니라, 생각의 방식 자체를 훈련시키는 접근이었다. 말과 사고의 습관, 정서의 밀도까지 반영된 언어모델은 그렇게 만들어졌다. 기술이 언어를 배우는 게 아니라, 문화를 배운다는 전제에서 출발한 셈이다.
배 상무는 ‘한국적 AI’를 ”AI가 한국어로 말하는 것이 아니라, 한국인처럼 생각하게 하는 일”이라고 표현했다. 실제로 ‘믿:음 2.0’은 고객센터, 스마트홈, 물류 등 여러 영역에 적용되며 성능을 입증하고 있다. 오픈소스로 공개된 이 모델은 독점보다 공유를 선택했고, 이는 KT의 기술 접근 방식을 단적으로 드러낸다.
(2) 또한, KT는 AI가 작동하려면 데이터를 학습할 수 있어야 한다는 점에 주목한다. 그래서 전국 데이터센터 기반의 클라우드 인프라와 함께, 마이크로소프트와 협력해 안정성과 확장성을 고도화했다. 기업 내부 데이터를 AI가 읽을 수 있도록 구조화하는 것이 시작점이라는 판단이다. 결국 AI의 뿌리는 모델 자체가 아니라, 연결 가능한 데이터에 있다.
팔런티어와의 협업도 같은 맥락이다. 많은 기업은 아직도 이메일, 회의록, 문서 등 비정형 데이터를 개인 랩탑 또는 내부망에 보관하고 있다. 이 데이터를 해석하고 연결하는 기술 없이는, 아무리 좋은 AI 모델이 있어도 활용하기 어렵다. KT는 바로 이 틈을 메우는 중간 계층 기술에 집중하고 있다.
(3) 마지막으로, KT는 AI 윤리를 구조로 포함시키고 있다. 2024년 설립된 ‘책임감 있는 인공지능 센터(RAIC)’는 ASTRI 원칙(책임성·투명성·포용성 등)을 바탕으로 실질적인 설계 가이드를 제시한다. AI 개발 단계마다 리스크를 점검하고, 모델카드를 공개하며, 결과에 대한 검증 가능성을 확보한다.
MWC 2025에서 배 상무는 “신뢰는 속도보다 구조에서 나온다”고 말한바 있다. KT는 실제 고객센터 AI에도 편향 제거, 투명 응답, 사용자 피드백 수용 체계를 적용해왔다. 사람과 기술 사이에 신뢰가 없으면, 아무리 뛰어난 성능도 외면받을 수밖에 없다.
배 상무는 발표 말미에 이렇게 강조했다.
”지금 많은 이들이 GPU와 모델에 집중하고 있지만, 사실 더 중요한 것은 데이터입니다. 지금 필요한 건 AI가 학습 가능한 데이터 구조를 만드는 일이고, 데이터를 클라우드화하는 것이 먼저입니다.“
기업 내부에 갇힌 비정형 데이터를 AI가 읽지 못하면, 아무리 뛰어난 모델도 제대로 작동하기 어렵다. 배순민 상무는 데이터를 클라우드에 올리는 일이야말로 AI 전환의 출발점이라고 강조했다. KT가 말하는 AI Transformation, 즉 AX는 단순한 기술 도입이 아니다. 사람의 일하는 방식과 데이터, 그리고 기술을 어떻게 연결할 것인지에 대한 근본적인 질문이다.