brunch

2025년 AI 대격변 : 미리 준비하는 6가지 트렌드

에이전트, 추론, 로봇, 무한 메모리까지

by 종원




안녕하세요, 써봐AI 종원입니다.



2023년 3월, GPT-3가 처음 나왔을 때 정말 깜짝 놀랐어요. 물론 지금의 ChatGPT 4 o1 Pro에 비하면 부족한 점이 많았지만, 그때도 이미 “미래에는 AI가 업무 최적화에 깊숙이 들어오겠구나” 라는 확신이 들었습니다.



그리고 예상대로 코딩부터 디자인, 사업계획서까지 넘나들며 AI가 일상 속으로 빠르게 스며들고 있죠. 그래서 오늘은 2025년 AI 트렌드를 살펴보려고 해요. AI의 흐름을 미리 파악하고 대응하면, 여러분도 시대 변화를 발 빠르게 따라갈 수 있을 거라 믿습니다.



그럼 본격적으로 시작해볼게요!






1. 에이전트 AI (Agentic AI)


agentic_AI.png 출처 - aisera (agentic AI)



에이전트 AI는 스스로 문제를 쪼개고, 필요한 데이터나 도구를 찾아내면서 목표 달성까지 해내는 AI를 말해요.



예를 들어, 쇼핑몰 기획 아이디어를 에이전트 AI에게 주면, 시장 조사부터 경쟁사 분석, 보고서 초안 작성까지 자동으로 진행합니다. 아침에 일정을 챙겨주거나, 날씨를 알려주고, 이메일 초안까지 작성해주는 식으로 일상적인 업무도 돕죠. 긴급 메시지가 오면 우선순위를 파악해 알려주고, 대화 맥락을 기반으로 자동 답변 초안을 만들어 주기도 해요.



브라우저 기반이라면 따로 설치 없이 웹 접속만으로 에이전트 AI를 실행할 수 있고, AgentGPT, God Mode, BabyAGI UI, Cognosys, Aomni 같은 서비스들이 대표적이에요.



혹은 운영체제(OS) 수준으로 AI가 들어간다면, MS 코파일럿이나 Apple Intelligence처럼 다양한 작업을 통합 자동화할 수 있습니다.






2. 추론 시간 컴퓨팅 (Inference Time Compute)


추론시간컴퓨팅.PNG




“질문에 답하기 전에 AI가 잠깐 생각한다” 는 개념이 바로 추론 시간 컴퓨팅이에요.



즉, 단순한 문제는 1~2초면 처리하지만, 복잡한 문제는 여러 단계를 거치면서 깊게 추론을 하죠. 이 방식 덕분에 훈련 데이터가 부족해도, 모델이 추론 중 스스로 논리를 보완할 수 있어요. 무거운 연산 장치를 쓰지 않고도 효율적인 계산이 가능해서, 모바일·IoT 기기에도 잘 맞아요.



대표 모델로는 ChatGPT o1이 있는데, 답변이 좀 느리지만 정확도가 높은 편입니다. Google PaLM-E도 로봇 제어에 단계별 추론을 적용했고, DeepMind AlphaFold는 단백질 구조 분석에 이 방식을 활용했죠. 2025년 즈음엔 이 추론 중심 설계가 훨씬 더 발전할 거라고 예상됩니다.






3. 초거대 모델 (Very Large Models)


chatgpt.PNG



GPT나 PaLM, LLaMA처럼 이미 엄청난 규모를 가진 모델들이 앞으로도 계속 커질 거예요. 지금도 수십억 ~ 수조 개 파라미터를 쓰는데, 50조 단위까지 올라갈 거라는 전망이 많죠. 그렇게 되면 사람처럼 복잡한 언어 뉘앙스를 이해하고, 좀 더 자연스럽고 정확한 답변을 줄 가능성이 커져요.



대표적으로 GPT-3와 GPT-4는 이미 업계 표준이 됐고, Google PaLM이나 Meta LLaMA도 주목받고 있습니다. 국내에서는 네이버의 HyperCLOVA X, LG의 EXAONE, KT의 믿음(Mi:dm) 같은 모델들이 계속 나오고 있어요.



한국어 중심 모델이라 국내 서비스엔 유리하지만, 글로벌 시장을 노리려면 여러 언어를 지원해야겠죠. 2020~2023년 사이에 총 11개의 초거대 모델이 나와서, 미국·중국에 이어 세계 3위 수준이라고 합니다.





4. 소형 언어 모델 (Small Language Models)


large.PNG 출처 - cobusgreyling.com



반대로, “가볍지만 똑똑한 AI” 도 있어요. 보통 1천만~10억 개 파라미터 규모로, 모바일 기기나 PC에서도 충분히 돌아갑니다.



대형 모델은 GPU가 없으면 돌리기 어렵잖아요? 하지만 초소형 모델은 컴퓨팅 파워가 적어도 동작하고, 배터리 효율도 좋아요. 오프라인에서도 쓸 수 있고, 비용도 절감돼서 데이터 프라이버시 보호에도 유리하죠.



대표 모델로는 OpenELM(애플 개발), MiniCPM-Llama3-V 2.5, TinyBERT, MobileBERT 등이 있어요.

지식 증류나 양자화 같은 기술을 써서 성능은 유지하면서 모델 크기를 확 줄인 거예요.



앞으로 엣지 컴퓨팅이 늘어나면서, 이런 소형 언어 모델의 쓰임새도 훨씬 많아질 거라고 봅니다. 스마트폰이나 IoT 기기에서도 AI가 빠르게 반응하는 시대가 머지않았어요.





5. 무한에 가까운 메모리 (Near-infinite Memory)




가끔 ChatGPT가 전 대화 내용을 까먹은 것처럼 답변해서 당황한 적 있으시죠? 그래서 나온 아이디어가, “AI가 이전 대화랑 데이터 전부를 기억하고 이어서 답변하면 좋겠다” 는 거예요.



마이크로소프트의 AI CEO인 Mustafa Suleyman와 CEO Satya Nadella는 Near-infinite Memory에 대해 다음과 같이 언급했습니다.



2025년까지 잊어버리지 않는 "near-infinite memory" 프로토타입을 개발 중이며, 이는 AI와의 모든 대화가 미래에 유용하게 활용될 수 있어 진정한 변화를 가져올 것.



결국 데이터가 어마어마하게 늘어나는 시대에, 메모리 제약을 없애는 건 AI 발전의 핵심입니다.

앞으로는 모바일·임베디드 기기에서도 이 기술이 적용될 거라, 무한 콘텍스트 시대가 진짜 오게 될 것 같아요.






6. 휴머노이드 로봇 (Humanoid Robots)


출처 - SBS 뉴스



마치 사람처럼 팔·다리가 달린 로봇이 공장·창고·우리 주변을 돌아다닌다고 상상해보세요.



테슬라의 Optimus Gen2는 걷는 속도가 30% 빨라졌고, 엔진AI SE01은 인간처럼 자연스럽게 걷고 움직이는 기술을 갖췄습니다. NVIDIA Cosmos 플랫폼이랑 강화학습 제어 기법으로, 로봇이 스스로 상황 파악하고 즉시 동작을 바꿀 수도 있어요. 제조업계에선 BMW나 메르세데스-벤츠가 이미 조립라인에 이 로봇들을 투입 중이고, 아마존은 물류창고에 Digit 로봇을 쓰고 있죠.



시장 규모도 2024년 20억 달러에서 2029년 132억 달러, 2035년엔 380억 달러까지 전망된대요.

물론 아직 배터리 기술이나 가격 문제가 크지만, 이걸 해결하면 일상에서도 사람처럼 일해줄 로봇을 보는 게 꿈만은 아닙니다.



결국 AI랑 하드웨어가 결합하면, 로봇 시장은 앞으로 엄청난 잠재력이 있을 거예요.






여러분의 의견은?



여기까지 2025년 AI 트렌드를 간략히 살펴봤는데요, 여러분은 어떻게 보시나요?



에이전트 AI나 추론 시간 컴퓨팅, 초거대 언어 모델, 소형 언어 모델, 무한 메모리, 휴머노이드 로봇 중 어떤 분야가 제일 기대되세요?



댓글로 의견이나 생각을 나눠주시면, 저도 새롭게 배우고 또 함께 이야기 나눌 수 있을 것 같아요. 앞으로도 계속해서 AI 흐름을 전달드리도록 하겠습니다.






간단 요약



1. 에이전트 AI (Agentic AI): 스스로 계획·실행하는 AI, 2025년엔 더 정교해질 전망

2. 추론시간 컴퓨팅 (Inference Time Compute): 답변 전 ‘생각할 시간’을 둬서 정확도와 자원 효율성 ↑

3. 초거대 모델 : 수십조 파라미터 이상, 언어 이해·생성 능력 급상승

4. 소형 모델 : 개인 기기에서도 가볍게 AI 활용 가능

5. 무한 메모리 : 대화 기록과 데이터를 전부 기억, 맥락을 잃지 않는 시스템

6. 휴머노이드 로봇 : AI + 로봇 공학 발전으로 더 현실화, 다양한 산업에서 빠르게 도입 예정




감사합니다!







'써봐AI'
오픈카톡방 링크




'써봐AI' 를 시작한 이유








keyword
작가의 이전글AI 영화가 CGV에? (feat. 구글 veo2)