2026년의 AI: 탐색을 넘어 증명의 시대로

신뢰와 투명성, 비용 절감, AI 에이전트와 피지컬 AI

by 성윤


jakob-owens-uWbRcJSJLV8-unsplash.jpg


2025년은 AI 기술이 산업 전반에 걸쳐서 빠른 속도로 확산되는 해였습니다. 그러는 한편, '놀라운 기술'과 '비즈니스적 현실' 사이의 간극이 명확히 드러난 시기이기도 했습니다. 수많은 기업이 경쟁에 뒤처지지 않기 위해 AI 도입을 서둘렀으나, 기대했던 생산성 혁명이나 드라마틱한 인력 대체 효과는 즉각적으로 나타나지 않았다고 보는 것이 맞을 것 같습니다.


2026년, 이제는 AI가 기업이 실질적인 이익으로 돌아와야 하는 시기를 맞이하고 있습니다. 2025년이 기업의 개념검증(PoC)과 파일럿 프로젝트를 통해 AI의 가능성을 타진했던 '탐색의 해'였다면, 2026년은 투입된 막대한 자본(CAPEX)과 운영 비용(OPEX)이 실제 비즈니스 가치로 환원되어야 하는 '가치 증명의 해'가 될 것으로 전망됩니다.




2025년, AI는 왜 돈을 벌지 못했을까?


- AI 투자는 늘어나는데 성과는 지체됐다


지난해, AI에 대한 기업들의 투자가 정점에 달했습니다. 딜로이트가 2025년 8월~9월 글로벌 1,854명의 고위 경영진을 대상으로 수행한 조사에 따르면, 전체 조직의 85%가 지난 12개월 동안 AI 투자를 늘렸으며 91%는 2026년에도 투자를 확대하겠다고 답했었죠. AI 버블을 우려해 투자를 안하는 것이, AI 발전 속도를 따라잡지 못하는 것보다 위험하다는 이야기도 여기저기서 들렸습니다.


그러나 이러한 공격적인 자본 투입에도 불구하고 실제로 측정 가능한 재무적인 성과를 거둔 기업은 많지 않습니다. 앞서 언급한 딜로이트 조사에서도, 에이전틱 AI를 사용하고 있다고 답한 응답자(전체의 57%) 중 오직 10%만이 '현재 에이전틱 AI로부터 상당한 ROI를 달성하고 있다'고 답했습니다.


MIT NANDA 이니셔티브가 2025년 8월 발간한 보고서에는 더 적나라한 숫자가 나옵니다. 해당 보고서는 AI를 도입한 기업 중 약 5%만이 매출 증가에 도움을 받았고, 나머지 95%의 기업은 여전히 AI를 테스트하거나 파일럿 단계에서 벗어나지 못하고 있다고 설명했습니다.


문제는 모델의 성능 자체보다는, 기업의 실제 업무 워크플로우에 AI를 제대로 통합하지 못한 것에 있습니다. AI를 단순히 도구로 사용하는 것이 아니라, 비즈니스 프로세스 자체를 AI에 맞춰서 완전히 재설계한 경우에는 성과를 내는 데에 성공했으나 기존 업무 방식에 소극적으로 AI를 덧붙이는 것만으로는 제대로된 효과를 보지 못한 것이죠. 당연히, 명확한 목표 없이 기술 도입 자체에만 매몰된 경우에도 좋은 성과를 내기 어려웠습니다.



- 자동화의 한계와 인간 역량의 재발견


2025년 초반의 가장 큰 오해 중 하나는 AI 에이전트가 업무를 완전 자동화하여 인력을 대규모로 대체할 것이라는 기대였습니다. 하지만 쉽지 않았죠. AI가 업무 자동화와 생산성 향상에 기여하는 것은 분명하지만, 인간의 개입 없이 독립적으로 완결할 수 있는 업무의 범위는 예상보다 제한적이었습니다.


맥킨지에 따르면, 현재 기업들이 채용 공고에서 요구하는 스킬의 70% 이상이 자동화 가능한 업무와 자동화가 어려운 업무 양쪽에서 모두 필수적으로 사용되는 것으로 나타났습니다. 즉, AI가 인간을 대체한다기보다 인간의 역량을 향상시키기 위한 도구로 사용될 때 성과가 날 수 있다는 것이죠.


재미있는 조사가 있는데요. Scale AI와 CAIS(Center for AI Safety)가 2025년 10월 발표한 '원격노동지수(Remote Labor Index, RLI)'라는 벤치마크입니다. 이 벤치마크는 단순한 코딩 테스트가 아니라, 글쓰기, 조사, 데이터 입력, 디자인 작업 등 실제 프리랜서 플랫폼에서 발생하는 경제적 가치가 있는 업무를 AI 에이전트에게 수행하게 한 결과를 분석했습니다. 결과가 충격적이었습니다. 가장 뛰어난 성능을 보여준 모델(마누스 1.5)이 전체 업무의 2.5%만을 성공적으로 완료했습니다. GPT-5는 1.6%만 완료하는데 그쳤어요.


이러한 낮은 성공률은 실제 업무 환경이 단순히 지시를 수행하는 것을 넘어, 클라이언트와의 대화를 통해 모호한 의도를 파악하고, 중간 결과물에 대한 피드백을 반영하며, 예기치 않은 돌발 상황에 대처해야 하는 복합적인 과정이기 때문입니다. 현재의 AI 에이전트는 반복적인 작업에는 능숙하지만, 이러한 '맥락 파악'과 '적응형 소통'이 필요한 영역에서는 여전히 인간을 대체하기 어렵습니다.



- 전사적 확장의 어려움: 파일럿의 허들


개념검증(PoC) 단계에서 성공적인 결과를 얻었더라도, 이를 전사적으로 확산하는 과정에서 기업들은 많은 어려움을 겪습니다. 통제된 환경에서 소규모 데이터로 진행되는 PoC와 달리, 전사 도입은 복잡한 변수들을 수반합니다.


우선 데이터 및 토큰 비용이 폭증할 수 있죠. 전사 직원이 AI를 활용하기 시작하면 API 호출량과 데이터 처리 비용이 기하급수적으로 증가합니다. 노후화된 IT 인프라에 최첨단 AI 모델을 연동하는 과정에서 기술적인 어려움이 발생하기도 합니다.


또 글로벌 확산에도 현실적인 어려움들이 따릅니다. 다국적 기업의 경우, 국가별로 상이한 법률과 규제로 인해 어려움을 겪을 수 있습니다. 또한 각 국가/지역에 산재된 데이터를 본사로 가져오는 데 있어서 실시간 데이터 수집/처리 과정에 병목 현상이 생기기도 합니다.


가트너는 생성형 AI 프로젝트의 30%가 개념검증 이후 2025년 말까지 포기될 것이라고 보기도 했습니다.



2026년 (1) '블랙박스'를 넘어라


2026년 기업들이 AI 공급업체나 내부 개발팀에 요구하게 될 첫 번째 기준은 '투명성과 '신뢰성'이 될 것입니다. 기업들은 AI를 '예측 가능하고 믿을 수 있는 조력자'로 만들기 위해 설명가능성, 윤리성, 내부 통제 장치를 한층 강화할 전망입니다.


딥러닝 기반의 AI 모델은 구조적으로 입력과 출력 사이의 연산 과정을 명확히 알 수 없는 '블랙박스(Black Box)' 특성을 지니고 있습니다. 해당 AI를 개발한 사람들조차 AI가 어떤 답을 뱉어낼지 정확히 예측할 수 없죠. 그러나 AI가 기업의 핵심 의사결정, 예산 집행, 고객 응대 등 리스크가 큰 영역에 직접적으로 개입하기 시작하면서, "AI가 왜 이런 결과를 도출했는가?"에 대한 설명 책임은 더 이상 회피할 수 없는 과제가 되고 있습니다.


AI가 사실이 아닌 정보를 마치 사실인 것처럼 확신에 차서 생성하는 할루시네이션(환각) 현상은 기업에 치명적인 리스크를 안겨줍니다. 실제로 최근에도 웃지 못할 사건들이 우후죽순 생겨나는 중이죠. 미국 캘리포니아주 검찰이 AI로 작성한 법원 서류에 존재하지 않는 판례를 인용했다가 적발되거나, 한국 경찰이 AI가 잘못 분석한 법리를 근거로 불송치 결정을 내리는 등 공공 및 법조계에서 심각한 오류 사례가 발생하고 있습니다. 글로벌 AI 싱크탱크인 '올어바웃 AI' 조사에 따르면 주요 AI 모델의 의료 정보 환각률은 15.6%, 법률 정보는 18.7% 정도라고 하네요.


기업이 AI의 오류로 인해 예산 보고서를 잘못 작성하거나 고객에게 잘못된 정보를 안내하여 손해배상 소송에 휘말릴 경우, "AI 알고리즘의 실수였다"라는 변명은 법적, 사회적으로 용인되지 않을 것입니다. 특히 의료나 금융, 국방과 같이 고도의 정확성이 요구되고 규제가 엄격한 산업군에서는 말할 것도 없겠죠.


이러한 문제를 해결하기 위해 여러 노력들이 이어지고 있습니다. 2023년부터 2025년까지 기업들은 환각 문제 해결을 위해 총 128억 달러를 투자했다고 합니다. 모델의 의사결정 과정을 투명하게 밝히려는 연구나, 기술적인 솔루션도 지속되고 있습니다.


오픈AI는 2025년 9월 논문 <언어 모델이 환각을 일으키는 이유(Why Language Models Hallucinate)>를 발표했는데요, AI가 '모른다'라고 답하기보다 그럴듯하게 추측해서 환각을 일으키는 이유에 대해 설명했습니다. 현재의 보상 체계는 AI 모델들이 '모른다'고 답하기보다 추측성 답변을 할 때 더 높은 점수를 받도록 되어 있기 때문이라는 겁니다. 쉽게 말해, 어려운 시험을 볼 때 아예 답안 표시를 안하면 0점이지만 5개 선택지 중 뭐라도 '찍어서' 제출하면 점수를 받을 확률이 높은 것과 비슷하죠. 그래서 오픈 AI는 자신있게 추측성 답변을 해서 틀리는 답변에 페널티를 부과하고, “모르겠다”는 식으로 불확실을 인정하는 답변에는 부분 점수를 주는 식으로 모델 평가를 바꾸자는 제안을 하기도 했습니다.


이 뿐만 아니라, Retrieval-Augmented Generation (RAG)처럼 신뢰할 만한 외부 지식에 기반해 답변하도록 유도하거나, 전문 분야 데이터로 추가 학습(파인튜닝)하여 사실 오류를 줄이는 기법 등 기술적인 접근도 계속 이어지고 있습니다. RAG는 현재까지 가장 효과적인 기술로, 제대로 사용하면 환각을 71% 까지 줄여준다고 합니다.

AI-hellucination-reduction-1024x620.webp Most Effective Fixes So Far (Allabout AI)


그럼에도 불구하고 할루시네이션을 '0'로 만들기는 쉽지 않습니다. 그래서 중요하게 부상하는 것이 사람의 개입, Human-in-the-Loop 입니다. 최종 검수자로서 도메인 전문성을 갖춘 인간의 개입(Human-in-the-Loop) 프로세스를 워크플로우에 의무적으로 포함시키는 것이 기업의 리스크 관리 핵심이 될 것으로 전망됩니다.



2026 (2) 지속 가능한 AI를 위한 필수 조건, 비용 효율화


- 특명, 추론 비용을 줄여라


과거에는 AI 모델을 개발하고 학습(Training)시키는 데 막대한 비용이 들었으나, 2026년에는 실제 서비스에서 모델을 구동하여 답변을 생성하는 추론(Inference) 비용이 학습 비용을 추월할 것으로 전망됩니다. 현재 AI 비용 구조에서 추론 비용은 이미 전체의 70% 이상을 차지하고 있는 것으로 알려집니다.


AI 모델이 똑똑해질수록 추론 비용은 기하급수적으로 증가합니다. 예를 들어, 구글의 최신 모델인 '제미나이 3 딥싱크(Gemini 3 Deepsync)'의 경우, 일반 프로 버전(0.81달러) 대비 약 100배 높은 추론 비용(77달러)이 발생하는 것으로 알려져 있습니다.


이러한 고비용 구조는 기업이 AI를 전사적으로 확산하는 데 있어 가장 큰 걸림돌이 되고 있습니다. 따라서 2026년 기업들의 기술 전략은 '최고 성능의 모델 도입'에서 '최적 비용의 모델 운영'으로 급격히 선회할 것입니다.



- 인프라 지각 변동: GPU 독주 체제의 균열과 ASIC/NPU의 부상


비용 절감을 위해 AI 인프라 하드웨어 시장에도 구조적인 변화가 일어나고 있습니다. 엔비디아(NVIDIA)의 GPU가 독점하던 시장에 주문형 반도체(ASIC)와 신경망처리장치(NPU)가 강력한 대안으로 부상하고 있습니다. 시장조사기관 트렌드포스는 2026년 AI 서버 출하량이 전년 대비 20% 이상 증가할 것으로 내다보면서, 특히 ASIC 기반 서버의 성장세가 GPU를 넘어설 것으로 분석했습니다.


실제로 구글은 자체 개발한 TPU를 AI 훈련·추론에 적극 활용하고 있고, 애플도 대규모 언어모델(Apple Foundation Model)을 엔비디아 GPU 대신 구글 TPU v4/v5p 클라우드에서 학습했다고 밝혔습니다. 메타 역시 구글 TPU 도입을 검토하는 한편 자체 AI 칩(MTIA) 개발에 박차를 가하는 등, 고비용의 GPU 의존도를 낮추기 위한 대안 모색이 활발합니다.


기업들은 범용적인 학습 단계에서는 유연성이 높은 GPU를 사용하더라도, 반복적이고 대규모 트래픽이 발생하는 서비스(추론) 단계에서는 가성비와 전력 효율이 뛰어난 TPU나 NPU를 혼용하는 방식을 채택하고 있습니다. NPU는 개발 문턱이 상대적으로 낮고 특정 연산에 최적화되어 있어 비용 절감의 핵심 키가 될 것으로 기대됩니다.



- AI 기업들의 마진 확보 전쟁: 적자 구조 탈피


AI 서비스를 제공하는 기업들 역시 수익성 개선에 사활을 걸고 있습니다. 디인포메이션(The Information)의 분석에 따르면, 오픈AI의 컴퓨트 마진은 2024년 52%에서 2025년 70%까지 크게 개선된 것으로 추정됩니다. 즉 챗GPT 유료 사용자가 20달러를 지불할 때, 연산 비용으로 약 6달러(30%)가 소요된다고 볼 수 있는 것이죠.


앤트로픽 역시 컴퓨트 마진을 2024년 -90%라는 심각한 적자 구조에서 2025년 말 53%, 2026년에는 가장 낙관적인 시나리오 하에 68%까지 끌어올릴 것으로 전망됩니다.


이러한 마진 개선은 모델 경량화, 효율적인 캐싱(Caching) 기술, 그리고 앞서 언급한 전용 반도체 도입을 통한 비용 절감 노력의 결과이며, 이는 AI 서비스 가격 안정화로 이어져 기업 고객들의 부담을 일부 완화시킬 수 있을 것으로 기대됩니다.



2026 (3) AI, 채팅창을 넘어 세상 밖으로


- Agentic AI: 시키지 않아도 일하는 '자율적 동료'


AI 에이전트 기능들은 조금씩 일상 속으로 들어오고 있습니다. 오픈AI는 2025년 초 '오퍼레이터' 기능을 공개했는데요. 웹 브라우저를 직접 제어하여 항공권 예약, 식료품 주문, 코딩 등 실질적인 작업을 수행할 수 있는 에이전트입니다. 앤트로픽도 '컴퓨터 유즈'라는 기능으로 클로드에 마우스 커서를 움직이고 키보드를 입력하며, 엑셀 작업을 하거나 소프트웨어를 조작할 수 있게 하고 있어요.


전자상거래에서 AI 에이전트가 사용자를 대신해 상품을 비교하고 최적 구매를 진행하는 사례들도 나타납니다. 실제로 2025 블랙프라이데이 기간, 어도비애널리틱스는 빅테크의 AI 에이전트 도입으로 소매 웹사이트 트래픽이 전년 대비 805% 증가했다고 분석했습니다. 세일즈포스도 블랙프라이데이 기간에 AI 쇼핑 에이전트가 142억 달러 규모에 달하는 온라인 판매에 영향을 미쳤다고 봤어요.


2026년은 사용자가 질문하면 대답하는 '대화형 AI(Chatbot)'에서, 목표를 주면 스스로 방법을 찾아 해결하는 '에이전틱 AI(Agentic AI)'로의 전환이 가속화될 것입니다. 에이전틱 AI는 스스로 계획을 수립하고, 도구를 사용하며, 복잡한 다단계 업무를 수행합니다. 가트너는 2028년까지 일상적인 업무 의사결정의 15%가 에이전틱 AI에 의해 자율적으로 이루어질 것이라고 예측했습니다.



- Physical AI: 로봇에 지능을 입히다


AI가 디지털 세계를 넘어 물리적 세계(Physical World)로 진입하는 '피지컬 AI(Physical AI)' 또는 '임바디드 AI(Embodied AI)' 역시 2026년의 핵심 화두입니다.


딜로이트피지컬 AI는 이제 본격적인 대중화(Mainstream deployment) 단계에 들어섰으며, 기술/비용 문제나 각종 규제와 같은 과제들이 해결됨에 따라 AI 기반 로봇은 특정 영역에 국한된 기술에서 벗어나 산업 전반의 주류로 자리 잡을 것이라고 전망하고 있습니다. 특히 피지컬 AI의 다음 진화 단계, 즉 인간의 활동 공간을 자유자재로 누비며 전례 없는 역량을 발휘하는 ‘휴머노이드 로봇’의 시대를 목격하게 될 것이라고 보고 있습니다.


실제로 미국 엔비디아, 테슬라 등 주요 기업들은 AI가 탑재된 휴머노이드 로봇과 자율주행 시스템 개발에 박차를 가하고 있습니다. 중국 빅테크도 피지컬 AI 상용화에 막대한 투자를 이어가고 있습니다. 투워즈헬스케어에 따르면, 피지컬 AI 시장 규모는 2024년 41억 2,000만 달러에서 2034년 611억 9,000만 달러로 폭발적으로 성장할 것으로 예상됩니다. 연평균 성장률은 31.26%에 달합니다.


다만 물리 세계로의 확장은 소프트웨어 AI와는 다른 도전과제를 동반합니다. AI가 물리 세계에서 안전하게 작동하기 위해서는 중력, 마찰력 등 물리 법칙과 인과 관계를 이해해야 합니다. 그래서 자주 언급되는 단어가 '월드모델'입니다. 월드모델이란 AI가 현실 세계의 물리법칙과 인과관계를 학습하여, 마치 가상환경에서 시뮬레이션하듯 미래 상황을 예측하도록 하는 것을 말하는데요. AI 석학 얀 르쿤은 2025년 말 직접 월드모델 전문 스타트업을 창업하며, LLM의 환각 문제를 구조적으로 해결할 열쇠가 월드 모델에 있다고 강조했습니다. AI의 대모로 불리는 페이페이 리 역시 자신의 스타트업 World Labs를 통해 3D 세계를 이해하는 모델 개발에 힘쓰고 있습니다.



2026년, AI의 변화에 성공적으로 대응하려면


2026년은 AI를 둘러싼 막연한 기대가 서서히 걷히고, 기술이 실제 비즈니스 성과로 검증받기 시작하는 해가 될 것입니다. 이제 “AI를 도입했다”는 말만으로는 더 이상 혁신을 설명하기 어렵습니다. 대신 “무엇이 달라졌는가”, “그래서 어떤 결과가 나왔는가”라는 질문이 자연스럽게 따라옵니다. 그리고 그 질문에는 숫자와 사례로 답해야 하는 시점이 되었습니다.


이런 흐름 속에서 기업이 고민해야 할 방향은 분명합니다. 모든 업무에 AI를 얹으려고 하는 방식보다는, 성과가 분명히 예상되는 특정 업무 영역에 집중하는 Applied AI 전략입니다. 이는 범용 거대언어모델(LLM)을 그대로 활용하는 것이 아니라, 산업과 업무의 맥락에 맞게 최적화하고, 기업 내부 데이터와 결합해 실제 현장의 문제를 해결하는 접근을 의미합니다. 지금은 무엇을 자동화할 것인지, 어떤 업무에 AI가 실질적인 도움을 줄 수 있는지, 그리고 그 구조가 앞으로도 글로벌/전사적으로 확장 가능할지를 차분히 점검해야 할 때입니다.


AI를 활용하는 방식 역시 달라져야 합니다. 결과를 무조건 신뢰하기보다, 오류와 할루시네이션을 점검할 수 있는 Human-in-the-Loop 체계를 함께 설계하는 것이 중요합니다. 또한 모든 업무에 고성능 모델을 적용하기보다는, 업무의 중요도에 따라 NPU나 TPU 등 비용 효율적인 인프라를 함께 사용하는 유연한 전략이 필요합니다. 특히 앞으로는 학습보다 추론 비용이 더 큰 부담이 되는 구조로 이동할 가능성이 높은 만큼, 비용 구조를 미리 고민하는 시각도 중요해지고 있습니다.


시선을 개인에게로 돌려보면, AI가 사람을 대체하는 시대라기보다, AI를 잘 이해하고 함께 일할 수 있는 사람이 그렇지 못한 사람을 대체하는 시대에 가까워지고 있습니다. AI 에이전트와 협업하고, 그 결과를 판단하고 책임질 수 있는 도메인 전문성과 기본적인 AI 리터러시는 앞으로의 업무 환경에서 점점 더 중요한 역량이 될 것입니다.


결국 2026년의 AI 트렌드는 한 가지 메시지로 정리할 수 있습니다. AI를 ‘있어 보이게’ 쓰는 것이 아니라, 실제로 쓸모 있게 만드는 것. 기술 그 자체보다도, 일하는 방식과 산업의 생산성을 조금씩 바꾸는 도구로 AI를 자리 잡게 할 때 비로소 의미 있는 전환이 시작될 것입니다.



매일 새로운 소식들이 쏟아지는 격변의 시기입니다. 쉽지 않겠지만, 흐름을 기회삼아 모두가 성장하는 한 해가 되었으면 좋겠습니다. 올해도 살아남아 봅시다^^; 새해 복 많이 받으세요!