LLM보다 SLM이 되어야 한다, 그리고 이 기술에는 육체가 필요하다.
LLM의 발전이,
하루가 멀다 하고 이루어지고 있다.
얼마 전 공개된 DeepSeek 모델의 성과가 주목되고 있다.
GPT o1의 성능을 거의 유지한 상태로 LLM을 작동시키는 가격을 절반 이하로 떨어트렸고
이것을 오픈소스로 대중에 무료 공개한 점에서 또 한 번 충격을 선사했다.
LLM을 활용하는
거의 모든 회사가 아직 수익을 내지 못하는 상황이다.
수익을 낼 수 없던 이유 중 하나는
LLM 구동 비용이 너무 비싸기 때문.
chatGPT의 openAI 조차
매년 조 단위의 손실을 감내하며 기술 개발에 열중이다.
그 부분에서 DeepSeek와 같은
최신의 LLM들의 구동 비용이 줄어드는 것은 반가운 소식이다.
하지만
아직 부족하다.
LLM의 가격은 더욱 떨어져야 하고,
그보다 더 중요하다 여겨지는 것은
SLM의 개선이 필요하다는 것이다.
SLM은 Small Language Model로
Large Language Model의 약자인 LLM과 비유하면
어떤 기술인지 잘 알 수 있다.
우리가 잘 알고 있는 LLM과 같이
문자를 바탕으로 논리적 추론을 해내는 인공지능 모델이면서
스마트폰과 같은 작은 모바일 디바이스에서 작동될 만큼 작은 언어 모델이다.
SLM과 주변 기술/인프라의 확충의 필요성을
"LM의 상용화"와 "시장의 개척/확대"의 측면에서 이야기해 보겠다.
본문의 제목은
"호문쿨루스"이다.
호문쿨루스는
"플라스크 속 작은 인간"의 의미로
정신(빛)만 있고 육체는 유리 플라스크뿐인 인조된 지적 존재이다.
그리고 호문쿨루스는
항상 육체를 지니길 원한다.
그리고 이것은
정확히 현재 LLM 기반의 서비스들이 향하는 방향이다.
우리가 인공지능 기술을 도입하며,
또 LLM을 도입하며 기대하는 것은
'자동화' 그리고 '개인화'이다.
자동화의 첫 번째 예시로는 휴머노이드를 들 수 있다.
로봇에 LLM을 결합해 물리적 노동을 대체하거나 보조하는 단계로 나아간다는 건 명확한 흐름이며, 산업적 가치가 있다.
두 번째로는,
스마트폰이나 모바일 디바이스에 내장된 개인 비서 역할의 AI를 통한 일상적인 자동화가 있다.
예를 들어
"~~과 내일 점심 사당에서 약속이 있는데, 맛집을 검색해서 이를 캘린더에 함께 적어줘"라는 명령을 한다면
AI는 스마트폰 속에서 육체가 있는 것처럼 움직여 명령을 처리해야 한다.
개인화의 측면에서는
모든 기술은 서비스가 될 환경에 finetune이 필요한데
이것을 더욱 정교하고, 개별적인 노드에 finetune이 가능해야 시장 확대 가능성을 열 수 있다.
하지만
이 과정에서 가장 큰 걸림돌은 바로 데이터의 프라이버시에 있다.
LLM 이 서버 기반으로 작동하면,
사용자의 모든 정보가 서버에 전송되고 저장되는데,
이는 기술의 상용화 및 시장 확대에 큰 걸림돌이다.
기업의 기밀이 될 수 있고, 개개인의 개인정보가 될 수 있다.
결국,
진정한 개인화 서비스는
클라우드에 의존하지 않는 방식
즉, 데이터를 로컬 디바이스에서 처리하는 기술이 필요하다.
이것이 SLM의 개선 필요성이다.
SLM이 on Device로 작동한다면
서버와의 의존도를 줄이고,
데이터를 사용자 디바이스에 안전하게 보관하며,
사용자 경험을 더욱 개인화된 방식으로 제공할 수 있다.
즉, 호문쿨루스처럼
작은 플라스크(디바이스) 안에 들어가는
SLM이 필요하다.
LM 기반 사업의 한계는
현실 세계에서 물리적이고 구체적인 도움을 줄 수 있는 기반,
즉 액추에이션과 기술적 인프라가 마련되지 않으면
성장의 한계가 있다.
다시 언급하지만
인공지능과 LLM 기술에서 우리가 가장 기대하는 것은
"개인화" 와 더욱 "직접적인 자동화"이다.
물리적 세계를 벗어나지 못한 인간에게 있어
물리적 서비스는 매력적이다.
LLM이 단순히 정보를 처리하고 추론하는 역할에서 벗어나,
이를 바탕으로 실제 행동을 수행할 수 있는 기술적 연결 고리가 필요하다는 것이다.
동일한 예제로
공장 로봇이 LLM을 통해 작업을 계획하고 판단한다 하더라도
그 판단이 물리적인 행동으로 이어지려면 액추에이터와 같은 장치들이 매끄럽게 작동해야 하고,
그를 지원하는 API와 시스템 인프라가 필요하다.
조금 더 풀어 설명하자면
LLM의 출력(문장들)을 물리적인 세계에서 직접 수행을 할 모터에게 맞도록 정형화 해야하고
높은 자유도의 세계에서 윤리적 제한을 만들어내야 한다는 것이다.
긍정적인 것은
로봇의 경우엔
모바일 디바이스 시장처럼
수많은 각기 다른 플랫폼 사업자가 있는 것이 아니며
또 서드파티 개발자들이 아직 많지 않기에
이 작업은
아직 시작하는 시장으로
Figure-01과 같은 회사들에서 적극적으로 구현하고 있으며
몇몇 회사들에 의해 잘 정형화된다면
시장 공급 가능성을 높일 수 있다.
오히려 문제라면
하드웨어의 성능 (배터리, 인간 환경에서의 작동)이 더 문제다.
다음 예제인
모바일 디바이스의 사례를 들자면
LLM이나 SLM이 아무리 똑똑하더라도,
디바이스 내에서 앱 간 통신이나 작업 수행을 제대로 연결하지 못한다면,
사용자가 원하는 자동화된 경험을 제공할 수 없다.
특히
서드파티 앱 간의 호출과 상호작용 문제가 크다.
앱 개발자들이 외부 호출을 받아들여 작업을 수행할 수 있는 환경이 마련되지 않으면,
사용자가 스마트폰 내에서 LLM이 진정으로 "행동" 하게 만드는 건 어렵다.
기존 앱에서의 대규모 수정이 필요하다.
LLM이나 SLM이 진정으로 효용성을 가지려면
단순히 지능적이거나 경량화된 모델을 만드는 데 그치지 않고,
그것이 물리적이고 실질적인 행동으로 이어질 수 있는 기반이 필요하며,
이를 위해 액추에이션 기술, API 인프라, 앱 간 상호작용 구조 등 실제 세계와 연결되는 다리가 반드시 마련되어야 한다는 것에 있다.
이게 완성되지 않는 한,
지금의 LLM은 여전히 플라스크 속 호문쿨루스처럼,
무한한 잠재력만 지닌 채 현실적 한계에 갇혀 있을 수밖에 없다.