AI전환(AX)-1
(주) 조회 수가 많은 글인데 디지털 혁신에 대한 4개 시리즈 강의 중 첫 번째인 '(1) 개념과 맥락' 강의 (3시간 20분, 유료)를 들어보실 것을 추천합니다. 아울러, 이와 관련된 2개의 강의를 더 소개합니다.
o 디지털 혁신, (2) 디지털 기술 (3시간, 유료)
o 인공지능 기술, 활용, 전망 (70분, 무료)
---
인공지능(AI) 관련 정책이나 기업 전략에 대한 논의를 살피다 보면, 'AI = 생성형(Gen) AI' 또는 'AI는 컴퓨터 과학/공학의 한 분야'라는 인식을 가진 분들이 많은 것 같다는 생각이 들 때가 있습니다. 쓸데없는 걱정(杞憂)이길 바라지만 말입니다. 2016년 3월, 이세돌과 알파고의 바둑 대결 이후 AI라는 걸 인지하게 된 일반인들이나 2022년 11월 말에 등장한 챗GPT를 통해 AI의 위력을 인지하게 된 일반인들은 'AI = 생성형 AI'라고 생각할 수도 있습니다. 그러나, 생성형 AI가 AI의 전부는 아닙니다. 정부 정책이나 기업에서도 똑같은 착각을 하는 분들이 있지 않은가 염려하게 됩니다. 지난 5월 말, 미국과 아시아의 대학, 연구소, 기업 등에 근무하는 AI 전문가 약 50명은 지금의 생성형/에이전틱 AI가 갖고 있는 문제점을 해결하고 일반인공지능(AGI)으로 나아가기 위한 수많은 연구들을 조사 분석한 결과를 264쪽의 논문(제목: Advances and Challenges in Foundation Agents ..)으로 발표한 바 있습니다. 생성형 AI와 LLM은 (지금 대세이긴 하지만) AGI로 가기 위한 여러 가지 경로 중 하나일 뿐입니다. 장기적으로 투자해야 할 기초연구와 단기적으로 새로운 시장을 창출할 수 있는 기술/제품에 대한 투자를 구분해야 합니다.
대학/대학원에서 AI를 전공했거나 AI/SW 기술 기업에서 일하시는 분들 중에는 여전히 'AI = 컴퓨터 과학/공학의 한 분야'라고 생각하는 분도 있는 것 같습니다. 저는 경영과 정보시스템을 전공하고 기업혁신 & 디지털 혁신 전략을 연구하는 사람으로서 그와 같은 생각에 대해서도 염려하게 됩니다. AI를 기술로만 본다면, AI를 활용한 기업혁신(즉, AI 전환, AX)이나 국민들의 일상생활, 교육, 직업, 그리고 국가 안보 등에 미치는 영향을 소홀하게 다루거나 편견을 가질 수 있기 때문입니다. 예를 들면, 기술자나 기업가들이 '안전한 AI'를 만들었다고 주장하더라도 그걸 잘못 쓰거나 악용하는 사람, 기업, 국가는 얼마든지 있기에 검증되기 전까지, 사용자/소비자들이 수용해서 효익을 얻기 전까지는 '안전한 AI'가 아닙니다.
한편, 정부 공무원이나 기업 경영자가 AI라는 강력한 기술을 가볍게 다룬다면, 국가/기업 경쟁력을 높이기는커녕 이미 확보한 위상조차 지키지 못할 수도 있습니다. 반도체, 자동차, 조선 등 국가 주력산업이 AI 전환을 성공적으로 실현하지 못한다면, 그런 결과가 될 수 있습니다. AI가 기술, 경제, 사회 혁신의 핵심 인프라가 되기 위해서는 기술자, 경영자, 정책수립자, 일반국민 모두가 AI를 바르게 이해하고 공감하는 것이 전제되어야 합니다. 기술자/공급자의 과속이나 사용자/수요자의 막연한 저항은 모두 바람직하지 않습니다.
위와 같은 생각에서 이 글에서 필자는 AI의 범위와 유형을 정리하고자 합니다. 객관적인 정의나 논의부터 소개하겠지만, 그렇지 않은 경우 필자의 주관적 해석이 포함된 것임을 미리 말씀드립니다. 또한, 이 글은 곧 출간될 저의 저서(제목: '디지털 혁신, DX에서 AI 전환으로', 부크크, 250616)에서 발췌한 것이라는 점도 밝혀 둡니다.
정책/전략 관점의 AI는 크게 기술 부분과 활용 부분으로 나눌 수 있다. AI 기술은 본서 2.1절에서 설명한 것처럼 기계가 사람처럼 ‘인지-학습/추론-실행’ 과정을 수행하기 위한 기술이며 컴퓨터 비전, 문자/오디오/비디오 인식, 자연어처리, 머신러닝/딥러닝, 자율주행, 챗봇 등을 포함한다. AI 활용은 AI를 개인생활, 기업활동, 정부 서비스 등을 더 효율적, 효과적으로 수행할 수 있게 만들고 그것을 방해하는 장애나 위험요인(예: 비윤리적 활용, 인간 배제)은 제거하는 활동이다.
OECD(2022)는 정책 개발 목적에서 AI를 5개 영역으로 나눈 개념적 프레임워크를 정의한 바 있다(<그림 6.3>과 <표 6.1> 참조). 이는 새롭게 등장하는 기술/시스템에 따라 계속 업데이트될 것이다. <그림 6.3>이 의미하는 바는 AI는 ‘데이터/입력’으로부터 ‘AI 모델’을 거쳐 ‘작업/출력’으로 이어지는 ‘기술’ 부분뿐만 아니라 인간과 지구가 경제적 목적을 위해 상호작용하는 ‘활용’ 부분을 포함한다는 것이다. ‘데이터/입력’은 텍스트, 이미지, 오디오, 비디오 등 현장에서 수집되는 데이터와 전문가 지식 등이 포함된다. ‘AI 모델’은 실제 또는 가상 환경을 수식, 통계, 그래프 등으로 표현(또는 설명)한 것으로 AI로 할 수 있는 일의 범위와 깊이, 수준 등을 좌우한다.
<그림 6.3> AI 분류 프레임워크 구성 (OECD, 2022)
<표 6.1> OECD의 AI 분류 프레임워크 개요
AI 모델 유형은 등장 순서에 따라 판별형(discriminative), 생성형(generative), 추론형(reasoning), 자율형/에이전틱(agentic), 행동형/물리적(physical) AI 등으로 나눌 수 있다. 판별형 AI는 정형/비정형 데이터와 hot/cold 데이터를 활용해서 데이터 분석/예측, 시뮬레이션, 최적화 등을 수행함으로써 작업 효율성과 의사결정 수준을 높이는 방식이다. ‘hot’ 데이터는 각종 센서를 통해 실시간으로 수집된 데이터를, ‘cold’ 데이터는 정기적으로 수집/분석/가공된 데이터를 가리킨다.
생성형 AI는 2022년 11월 말 오픈AI가 발표한 챗GPT에서 시작된 것으로 대규모언어모델(LLM: Large Language Model)을 기반으로 문서, 이미지, 오디오, 비디오, 소스코드 등 다양한 콘텐츠를 생성하는 데 활용된다. LLM은 구글 연구자들이 2017년에 발표한 논문에서 제시한 트랜스포머(transformer)를 구현한 것이다. 기존 언어모델들은 주어진 데이터의 순차적 정보만 활용하지만, 트랜스포머는 어텐션(attention) 알고리즘을 통해 데이터의 상호관계 즉, 전체적인 맥락과 의미를 이해하게 만든 것이다. 생성형 AI는 2023년 이후에도 계속 새로운 기술, 예를 들면, 검색증강생성(RAG: Retrieval Augmented Generation), 인간피드백에 의한 강화학습(RLHF: Reinforcement Learning with Human Feedback), 전문가조합(MoE: Mixture of Expert) 등에 의해 기능/성능이 보강되어 적용 범위를 넓혀가고 있다. LLM 자체는 폐쇄형, 대규모, 고비용/고성능, 중앙집중식 클라우드 AI 방식 위주에서 개방형(‘오픈소스’), 경량화(‘sLLM’), 저비용/고효율, 분산형 온디바이스 AI 방식이 확대되고 있다. 오픈AI가 전자의 대표 기업이라면, 중국의 딥시크는 후자의 대표 기업인 셈이다. 생성형 AI는 비즈니스 측면에서 큰 기회를 제공하지만, 그만큼 위험도 큰 기술이다. 예를 들면, 아직은 무시할 수 없는 수준의 ‘환각(hallucination, 오류)’을 보일 때가 있고 엄청난 양의 에너지를 사용하며 소수의 글로벌 테크기업이 기술/솔루션 공급을 주도하고 있다. 추론형 AI는 기존 생성형 AI의 약점인 추론 기능을 보강한 모델이다. 생성형 AI는 결과를 즉각적으로 유추(inferencing)하지만, 추론형 AI는 문제 이해, 조사분석, 결과 종합 식의 신중한 추론(reasoning)을 거친다.. 그러나, 이것도 딥러닝의 근본적 한계를 극복한 건 아니어서 새로운 돌파구(예: 규칙 기반 AI 결합)가 필요한 상태이다. 추론형 AI도 (인간처럼 논리적으로 추론하는 게 아니라) 여전히 확률적으로 가장 그럴듯한 패턴을 찾아서 답으로 내놓는 방식이다.
에이전틱 AI는 AI가 단순한 정보 제공이나 특정 작업 수행, 콘텐츠 생성 등을 돕는 것을 넘어서 복잡한 문제를, 목표지향적으로 해결하는 모델이다. 에이전틱 AI는 임무를 받으면 그것을 완수하기 위한 여러 개의 단위작업을 정의하고 각 작업을 완수할 AI 에이전트를 가동한 후 원하는 결과가 나올 때까지 자율적으로 실행을 반복한다. 각 AI 에이전트는 아래 4개 그룹에 속하는 기능들을 수행한다.
∙ 인지 : 텍스트, 오디오, 이미지, 기타 데이터 입력
∙ 기억 : 단기기억(작업 공간, 캐시), 장기기억(데이터 저장소, 대화 저장소, 사례 기억)
∙ 계획 : 심사숙고, 추론, 분해 등 (LLM 활용)
∙ 도구 실행 : 지식 검색, 웹 서치, API 호출, 구성요소 가동.
각 에이전트에 기획자, 개발자, 실행자, PM 등 역할을 부여해서 인간 작업자를 대신하거나 보조하는 ‘디지털 인력’으로 활용할 수도 있다. 예를 들면, PM 에이전트가 문제를 정의-분석할 기획자 에이전트, 솔루션을 설계-구현할 개발자/실행자 에이전트를 선정해서 임무를 부여하고 수행 결과를 통합하도록 만들 수 있다는 것이다. 에이전틱 AI는 MCP(Model Context Protocol), A2A(Agent to Agent) 같은 개방형 표준이 등장함에 따라 빠르게 확산하고 있다. 2024년 11월, 앤트로픽(Anthropic)이 발표한 MCP는 여러 컴퓨팅 자원(예: 스토리지, 프로세서, 애플리케이션)을 클라이언트-서버 방식으로 연결해 준다. 2025년 4월, 구글이 발표한 A2A는 특정 에이전트 입장에서 다른 AI 에이전트가 가진 역량(예: 메모리, 컨텍스트 이해, 추론)을 연결, 활용할 수 있게 해 준다. 에이전틱 AI는 아직은 믿고 맡길 정도의 충분한 신뢰성이나 결과 예측 능력, 보안성, 지속성 등이 부족하고, 윤리 문제나 책임 소재 등에서 문제가 발생할 수도 있으므로 적용 대상 업무를 신중하게 선별, 적용해야 한다.
에이전틱 AI는 LLM 개발 기업(예: 오픈AI, 앤트로픽, 퍼플렉시티), 클라우드 기업(예: AWS, 마이크로소프트, 구글), IT 서비스 기업(예: 세일즈포스, SAP), 컨설팅 기업(예: 딜로이트, PwC), 일반기업(예: 우버, 링크드인)과 스타트업들이 새로운 산업생태계를 형성하고 있다(참조: CB Insights, 2025).
∙ 인프라스트럭처 (예) 개발 플랫폼, 멀티 에이전트 오케스트레이션, 인증, 메모리, 데이터 큐레이션, 평가/관찰, 웹 검색 등
∙ 수평 애플리케이션 (예) 생산성 도구, 개인비서, 워크플로우 관리, 고객 서비스, 데이터 분석, SW 개발, 회계, 보안, 마케팅, HR 등
∙ 수직 애플리케이션 (예) 금융/보험, 헬스케어, 공급망/물류 등.
피지컬 AI는 AI와 물리적 장치를 연결함으로써 시너지를 내도록 만드는 것이다. 실체가 없는 AI로서는 물리적 장치를 이동 또는 작동함으로써 현실세계를 제어할 수 있게 되고, 자율주행자동차, 부품 가공/조립용 로봇, 배송/운반 장치 같은 물리적 장치는 AI를 통해 고수준의 지능적 작업을 수행할 수 있게 된 것이다. 피지컬 AI는 ‘몸’을 가진 AI라는 점에서 ‘임바디드(embodied) AI’라고도 한다. AI가 PC나 스마트폰 같은 소규모 장치에도 탑재되기 위해서는 고성능 컴퓨터에서 중앙집중식 클라우드 방식으로 운영되는 LLM이 아니라 소규모/분산형 컴퓨팅 방식으로 운영되는 온디바이스 AI, 엣지 컴퓨팅 등이 뒷받침되어야 한다. 또한, 피지컬 AI는 고수준의 센서, 배터리, 경량화 등 HW 기술, 멀티모달 LLM 기반 위에서 사물의 동작을 이해-판단하는 대형세계모델(LWM: Large World Model)과 실제 행동으로 전환하는 대형행동모델(LAM: Large Action Model), 초고속/저지연 & 실시간/실감형 통신 기술(예: 5G/6G) 등이 뒷받침되어야 한다. SW 상태인 AI의 오류도 심각한 문제지만, HW를 가진 AI의 오류는 더 큰 위험을 초래할 수 있으므로 안전성, 신뢰성에 대한 철저한 검증/확인이 전제되어야 한다.
피지컬 AI는 AI와 로봇 간 기술융합의 결과이면서 가상세계와 현실세계를 연결하는 메타버스와도 밀접한 연관성을 갖게 될 것이다. 실제 테슬라, 보스턴다이내믹스, 혼다 등 휴머노이드 생산 기업들이 피지컬 AI를 준비하고 있다. 가상물리시스템(CPS)은 컴퓨터 시뮬레이션을 통해 최적해를 찾아내는 가상세계와 실제 재화의 생산-유통이 진행되는 현실세계가 긴밀하게 상호작용하도록 만든 시스템이다. CPS의 가상세계 부분을 디지털 트윈(Digital Twin)이라고 하며 여기에 VR/AR 같은 가상화/실감화 기술을 결합한 것을 버추얼 트윈(Virtual Twin)이라고 한다. 피지컬 AI가 메타버스로 구현될 디지털/버추얼 트윈과 상호작용하게 되면 다양한 영역에서 인간 역할을 대체하거나 획기적으로 증강하게 될 것이다.
Tao(2024)는 실무에서 활용하는 형태를 기준으로 지금까지 등장한 AI 모델 유형을 최적화, 시뮬레이션, 규칙 기반, 그래프, 비(非)생성형 머신러닝, 생성형 모델 등 6가지로 분류하였다(<표 6.2> 참조).
<표 6.2> AI 모델 유형별 특성과 적용 예
<표 6.2>에서 ‘딥러닝-생성형’ AI 모델 외에는 모두 ‘판별형 AI’에 속하며 실무에서는 여전히 많이 쓰이는, 중요한 모델들이다. 최적화, 시뮬레이션, 규칙 기반, 그래프 모델 등은 통계학 또는 컴퓨팅 알고리즘을 활용한다. 머신러닝은 데이터를 활용해서 기계를 훈련하는 방식이며, 그중 하나인 딥러닝은 인공신경망(Artificial Neural Network)을 활용한다. ‘非생성형 머신러닝’에는 전통적 머신러닝과 생성형 AI 등장 이전에 나온 딥러닝 모델인 CNN, RNN, GAN 등이 포함된다.
Tao(2024)는 <표 6.3>에 보인 것처럼 여러 가지 AI 유스케이스를 12개 카테고리로 나누고 각 유스케이스별 AI 모델 적합도를 상(high)/중(medium)/하(low)로 평가하였다.
<표 6.3> AI 유스케이스별 AI 모델 적합도
12가지 유스케이스 카테고리는 예측, 계획, 지능적 의사결정, 자율 시스템, 분류, 추천, 인지, 지능적 자동화(예: 스마트 공정), 변칙/이상(anomaly) 탐지, 콘텐츠 생성, 챗봇, 지식 발견 등이다. 참고로, 유스케이스(Use Case)란 사용자가 특정 시스템을 이용하는 방식을 가리킨다. 예를 들면, 우리가 스마트폰을 활용하는 여러 가지 방식 즉, 전화 통화, 인터넷 검색, 일상 기록, 통역 등이 유스케이스에 해당한다.
<표 6.3>에 의하면, 예를 들면, 생성형 AI 모델은 콘텐츠 제공, 챗봇, 지식 발견 등에는 적합하지만, 예측, 계획, 지능적 의사결정, 자율 시스템 등에는 적합하지 않다. 예측 문제에는 종래의 머신러닝이나 시뮬레이션, 계획 문제에는 최적화나 그래프 모델이 적합하다. 최적화 모델은 계획, 의사결정, 자율 시스템 등에는 적합하지만, 그 외의 문제에는 적합하지 않다. 콘텐츠 생성에는 생성형 AI와 시뮬레이션 모델이 적합하고 나머지는 적합하지 않다. 그래프 모델은 예측, 자율 시스템, 인식, 콘텐츠 생성 등을 제외한 나머지 문제에 적합하다. 결론적으로, 특정 AI 모델 유형이 모든 문제에 적합한 것은 아니기에 문제 특성에 맞는 모델을 선정, 활용해야 한다. //
<참고문헌>
OLiu, Bang et al.(2025), 'Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems', arxiv.org, Mar 31.
OECD(2022), OECD Framework for the Classification of AI Systems, OECD Digital Economy Papers No. 323, Feb.
Tao, Christopher(2024), "Do Not Use LLM or Generative AI for These Uses Cases", Towards AI, Aug 11.
#AI의미 #AI범위 #AI유스케이스 #AI모델 #판별형AI #생성형AI #추론형AI #에이전틱AI #피지컬AI #비생성형AI #대규모언어모델 #LLM #대형세계모델 #LWM #대형행동모델 #LAM #AI에이전트 #트랜스포머 #어텐션 #가상물리시스템 #CPS #디지털트윈 #버추얼트윈 #디지털혁신 #부크크