2025 AI 회고: 응답하는 AI에서 수행하는 AI로

by 박재현

2025년이 저물어 갑니다. 돌이켜보면 올해는 AI 기술로 인해 인류 역사상 그 어느때보다 역동적인 해였습니다. 단지 AI 성능이 좋아졌다거나 새로운 모델이 쏟아졌다는 의미가 아닙니다. 오히려 AI가 무엇을 할 수 있는지에 대한 우리의 인식 자체가 바뀐 해였습니다.


이 글은 2025년을 장식한 일곱 가지 AI 이슈를 회고한 기록입니다. 개별 사건의 나열이 아니라, 기술이 어떤 방향으로 흐르고 있는지를 읽어내보고자 합니다. 그리고 이 흐름이 우리가 일하고, 만들고, 생각하는 방식을 어떻게 바꾸고 있는지 함께 들여다보려 합니다.




1. DeepSeek R1 쇼크


2025년은 연초부터 격변의 서막으로 시작했습니다. 흔히 “DeepSeek R1 쇼크”로 불린 1월 20일의 사건입니다. 2024년 12월, OpenAI가 o1을 내놓으며 추론형 모델의 시대가 열렸지만, 그 추론이 어떤 레시피로 탄생했는지는 여전히 블랙박스 상태였습니다.


그런데 불과 두 달 남짓한 시간 차로 중국 기업이 추론형 모델을 오픈소스로 공개했고, 기술 보고서에 학습의 설계와 절차를 상당 부분 드러냈습니다. 더 큰 파장은 “프론티어 모델을 만들기 위해 반드시 막대한 GPU가 필요하다”는 신화에 균열을 냈다는 점입니다. 시장은 민감하게 반응했고, 한동안 엔비디아 주가까지 흔들리며 상징적인 장면을 남겼습니다.


solen-feyissa-MHgLD0-9VvM-unsplash.jpg


무엇보다 중요한 것은, 이 사건이 이후 중국발 오픈소스 모델 공개 흐름의 기폭제가 되었고, 경쟁의 규칙을 다시 쓰게 했다는 점입니다. 끝내 OpenAI마저 오픈소스 모델 공개라는 선택지 앞에 서게 된 배경에는, 이 ‘추론의 탈신비화’가 놓여 있었습니다.




2. Agentic AI의 급부상


두번째는 에이전트, 더 정확히 말하면 Agentic AI의 급부상입니다. 2월 초 OpenAI의 DeepResearch가 보여준 것은 “검색을 잘하는 챗봇”이 아니라, 스스로 필요한 도구를 판단하고 정보를 탐색하며 가공·재구성하는 일련의 업무 흐름이었습니다. 여기서부터 토큰은 단순한 비용 지표가 아니라, 사고의 길이이자 작업의 규모를 의미하게 됩니다.


깊이 생각하고 넓게 탐색하려면 더 많은 토큰을 태워야 하고, 그 토큰은 요금제의 경계선을 만들었습니다. 200달러 이상의 고비용 플랜이 확대된 것은 단지 가격 정책이 아니라, 지능을 사용하는 방식이 ‘소비’로 구조화되기 시작했다는 신호였습니다.


동시에 Anthropic의 MCP 프로토콜이 빠르게 대중화되며, 에이전트가 외부 도구·데이터·서비스와 연결되는 표준 문법이 정리되기 시작했습니다. 3월의 Manus AI까지 흐름을 잇자, 올해의 흐름은 분명해졌습니다. 이제 AI는 ‘대답’이 아니라 ‘일’을 팔기 시작했습니다.





3. Claude Code와 바이브 코딩


세번째 변화는 '파괴적 AI 시대'의 첫무대가 된 코딩 영역의 이야기입니다. 이미 GitHub Copilot이나 Cursor 등이 코딩 보조의 가능성을 보여주고 있었지만, Claude Code의 등장은 결이 달랐습니다. IDE 확장 형태가 주류였던 흐름 속에서 CLI 인터페이스가 다시 중심으로 들어왔다는 점도 흥미로웠지만, 더 결정적인 변화는 개발자의 핵심 역량이 ‘AI를 얼마나 잘 활용해 레버리지를 내는가’로 확장되었다는 점입니다.


이 과정에서 토큰 사용량은 곧 생산성과 실험 강도를 가늠하는 지표가 되었고, 코딩 에이전트에서 발생하는 토큰 사용량이 폭증하면서 AI 프론티어 기업들도 이를 핵심 비즈니스 모델로 인식하기 시작했습니다.


스크린샷 2025-12-30 오후 10.59.31.png


여기에 올해 개발 커뮤니티를 관통한 키워드가 하나 더 얹혔습니다. 안드레 카파시가 제시한 ‘바이브 코딩’입니다. 바이브 코딩은 개발자가 대략적인 의도와 방향을 던지고 AI가 빠르게 형태를 만들어 내면, 그 결과물을 보며 개발자가 다시 수정 방향을 제시하는 방식입니다. 여기서 중요한 것은 단지 생산성이 아닙니다. 개발의 중심이 ‘코드 작성’에서 ‘목표의 명확성’으로 이동했다는 점입니다.


그래서 올해 실리콘밸리의 대량 해고와 신입 개발자 취업난을 그저 경기 탓으로만 보기는 어렵습니다. AI가 산업에 직접적인 압력을 가하기 시작한 첫 현장 중 하나가 개발 영역이었고, 역설적으로 AI 시대를 연 직업군이 가장 먼저 구조 변화의 파도를 맞는 모양새가 되었습니다.





4. 이미지 생성의 진화


3월, ChatGPT가 다시 한번 대중에게 크게 바이럴되었습니다. GPT-4o의 이미지 생성 기능이 공개되자 사람들은 자신의 프로필 사진을 지브리 애니메이션 스타일로 바꾸는 데 열광했습니다. 8월에는 구글의 Nano Banana가 피규어 스타일로 또 한 번의 유행을 만들어냈습니다. AI가 문화적 밈으로 기능하기 시작했고, 이는 AI 서비스를 대중에게 확대 보급하는 데 중요한 역할을 했습니다. 사람들은 기술이 아니라 재미와 자기표현의 수단으로 AI를 받아들였습니다.


SSC_20250327160528_O2.jpg.jpeg


물론 실용적 관점에서도 큰 의미가 있습니다. 이미지 생성 모델의 고질적 약점이었던 컨텍스트 유지 능력이 의미 있는 진전을 이뤄냈습니다. 하나의 캐릭터나 스타일을 일관되게 유지하며 여러 장면을 창작할 수 있게 된 것입니다.


그러나 더 중요한 전환이 있습니다. Image-to-Image 모델의 진화는 진정한 멀티모달 추론의 방향성을 제시하고 있습니다. 컨텍스트를 유지한다는 것은 이미지 간의 인과관계와 일관성을 파악한다는 의미입니다. 같은 캐릭터가 다른 포즈를 취할 때, 모델은 스타일을 복사하는 것이 아니라 대상의 본질적 속성을 이해하고 변환합니다. 이는 언어와 시각이 하나의 통합된 이해 속에서 상호작용하는 진정한 멀티모달 추론의 시작입니다.





5. 비디오 생성을 넘어 월드 모델로


5월 Veo3, 9월 Sora2의 공개는 비디오 생성 AI를 실험의 영역에서 일상으로 밀어 넣었습니다. 간단한 프롬프트만 주어져도 자연스러운 장면과 대사, 스토리가 붙고 비디오와 함께 오디오도 함께 생성되었습니다. 그 결과 AI가 생성한 영상은 SNS 피드를 넘어 광고, 홍보, 안내, 보도용 영상까지 빠르게 확산되었습니다. 언제부터인가 ‘AI가 만들었다’는 사실은 주목할 만한 정보가 아니라, 당연한 전제가 되었습니다.


이 시점부터 영상은 더 이상 실재의 기록이 아닙니다. 그것은 '그럴듯한' 장면의 재구성이며, '그럴듯함'이란 세계가 어떻게 작동하는지를 이해하고 있다는 신호입니다. 물체는 이유 없이 움직이지 않고, 상호작용에는 맥락이 있으며, 사건은 인과를 따릅니다.


cosmos.png


우리가 ‘자연스럽다’고 느끼는 것은 자연 현상과 사회적 상황을 관찰하며 축적해온 암묵적인 규칙을 어기지 않을 때입니다. 비디오 생성 모델은 이제 픽셀을 그리는 단계가 아니라, 그러한 규칙을 내부에 구성하고 시뮬레이션하는 단계로 진입했습니다. 이런 변화는 비디오 생성모델에만 해당되는 것이 아니라 월드 모델과 Physical AI가 지향하는 방향과 정확히 일치합니다.





6. 행동을 스케일링하다 VLA 모델


3월 Figure AI를 시작으로 엔비디아, 구글까지. 2025년 로보틱스와 Physical AI의 중심에는 VLA(Vision Language Action)라는 키워드가 있었습니다. 자율주행에서도 Wayve, 샤오펑, 딥루트 같은 플레이어들이 한 층 더 공격적으로 VLA 전략을 자신감 있게 공개하였습니다.


VLA는 모델의 출력 토큰이 모니터의 대화창에 머무는 것이 아니라 직접 현실 세계에 영향을 미칠 수 있는 행동(Action)으로 조작면(Control Surface)을 이동한 결과입니다. VLA를 주목해야 하는 이유는 일반화된 인공지능이 해결할 수 있는 영역이 확장되었다는 것만이 아닙니다. 본질은 행동에도 스케일링의 법칙이 적용되기 시작했다는 사실입니다. 스케일링 법칙이 적용되었다는 것의 의미는 "더 큰 모델이 더 똑똑해진다"는 단순한 명제가 아닙니다. 그것은 문제 해결의 방향성이 바뀌었다는 뜻에 가깝습니다.


figure-ai.jpeg


즉, 연구실에서의 모델 설계가 아니라, 현실 세계에서 데이터 수집 사이클을 누가 더 빠르고 효과적으로 돌릴 수 있는가가 승부처가 되었습니다. 로봇과 자동차가 움직이고, 실패하고, 다시 시도하는 과정 하나하나가 모델을 개선하는 원료가 되는 구조입니다.


이렇게 되면 가장 중요한 질문은 "지금 당장 누가 더 똑똑한 모델을 만들었나"가 아니라, "누가 더 많은 세계를 자신의 학습 루프에 묶었나"로 이동합니다. 수백만 대의 차량을 도로에 투입하고, 수천 대의 로봇을 창고와 공장에 배치하며, 그들이 마주하는 모든 상황을 데이터로 전환할 수 있는 기업이 결국 이 경쟁에서 앞서갈 가능성이 높습니다.




7. Gemini 3의 역습: 스케일링에 대한 재평가


12월, OpenAI에 ‘코드 레드’가 발령되었다는 이야기가 업계에 퍼졌습니다. 철옹성처럼 보이던 OpenAI의 주도권에 균열이 생기기 시작했음을 상징하는 사건이었습니다. 그 배경에는 구글 Gemini 3의 공개가 있었습니다.


Gemini 3와 함께 구글은 다시 한 번 구조적 강점을 드러냈습니다. 자체 AI 칩, 거대한 미디어 플랫폼, 그리고 안정적인 현금 창출 능력까지. 이 모든 요소를 동시에 갖춘 기업은 드뭅니다. 그 결과, OpenAI가 단독으로 AI 산업을 주도하기는 점점 어려워질 것이라는 전망은 힘을 얻기 시작했습니다.


Gemini-3.0-Pro.jpeg


그러나 더 중요한 것은 기술 흐름입니다. Gemini 3는 새로운 방식의 사전 훈련을 적용한 것으로 알려졌지만, 구체적인 방법은 공개되지 않았습니다. Gemini 3가 던진 핵심 메시지는 분명합니다. 사전 훈련과 스케일링은 끝나지 않았다는 것입니다. 더 나은 사전 훈련 방식은 여전히 의미 있는 도약을 만들어낼 수 있으며, 이는 기술 투자 방향 전체를 다시 묻게 합니다.




마무리하며


2024년 이 맘때쯤을 돌아보면, 우리는 AI가 ‘언젠가 가능할 것’들에 대해 이야기하고 있었습니다. 그러나 불과 1년 만에 몇몇 가능성은 현실이 되었고, 절대 정복당하지 않을 것 같던 벤치마크들이 하나둘 정복되고 있습니다. 올 한해는 이 흐름을 눈대중으로 쫓아가는 것만도 벅찼던 한해였던 것 같습니다.


중요한 사실은 이러한 변화의 속도 뒤에는, 성능의 진보보다 ‘활용의 구조’가 먼저 바뀌었다는 점이 있습니다. 에이전트가 업무를, 비디오 생성이 콘텐츠를, VLA가 행동을 AI의 기본 단위로 바꾸면서 사용 방식의 판이 뒤집혔습니다.


더 이상 AI는 미래의 가능성이 아닌 현실의 레버리지입니다. 그리고 이미 발빠른 기업들과 인재들은 그 레버리지 위에 올라탔습니다. 1인 개발자가 스타트업 수준의 제품을 만들고, 소규모 팀이 대기업의 결과물을 재현하며, 창작자들은 몇 시간 만에 캠페인 전체를 구성합니다. 이들은 지능의 발전 속도보다 더 무서운 속도로 격차를 벌리고 있습니다.


이제 승부는 기술을 얼마나 빠르게 내 것으로 만드는가에서 갈립니다. 아마 앞으로 우리가 계속 마주할 질문은 “AI가 무엇을 할 수 있는가”가 아니라 “나는 AI와 함께 무엇을 하고 있는가”일 것입니다. 2026년은 그 질문에 대한 자신만의 답을 직접 실험하는 사람들의 해가 되지 않을까 싶습니다.


작가의 이전글AI는 정말 '진화'하고 있습니까?