brunch

03. AI Ready Data

I. AI 글로벌 동향

by 정재헌

2025.8.6일 가트너의 "2025 AI 하이프 사이클" 보고서에 따르면 올해 가장 주목해야 할 인공지능(AI) 혁신 기술로 'AI 에이전트'와 'AI 레디 데이터'를 선정했다고 밝혔다.[출처]


dataready.png


가트너 보고서에 따르면 AI Agent 앞에 AI.Ready Data를 전면에 배치했다.



AI 에이전트는 AI 기술을 활용해 디지털과 물리 환경에서 인지하고 의사결정을 내리며 행동을 수행해 목표를 달성하는 자율 또는 반자율 소프트웨어다. 기업들은 대규모언어모델(LLM) 등 다양한 AI 기술과 사용 사례를 활용해 복잡한 작업을 수행할 수 있는 AI 에이전트를 개발하고 있다.


칸다바투 애널리스트는 "AI 에이전트의 이점을 최대화하려면 가장 적합한 비즈니스 맥락과 사용 사례를 식별해야 하지만, 모든 AI 에이전트가 똑같지 않고 상황도 항상 다르기 때문에 어려운 과제"라며 "AI 에이전트는 더욱 강력해지겠지만 모든 사례에 일률적으로 적용할 수 없으며, 개별 상황의 요구에 따라 사용 가능 여부가 결정될 것"이라고 말했다.


AI 레디 데이터는 데이터 세트가 AI 애플리케이션에 최적화되도록 보장해 정확성과 효율성을 향상하는 기술이다. 데이터의 준비 상태는 특정 AI 사용 사례에 얼마나 적합한지로 결정되며, 이는 해당 사용 사례와 AI 기술 맥락에서 판단된다.


가트너는 AI에 대규모 투자하는 기업들이 데이터 관리 관행과 역량을 AI 환경에 맞게 발전시켜야 한다고 조언했다. 이를 통해 기존 및 향후 비즈니스 요구사항 충족, 신뢰 확보, 위험 및 준수 문제 방지, 지적재산 보호, 편향과 환각 감소를 달성할 수 있다는 설명이다.[출처] 투데이에너지(https://www.todayenergy.kr)



OpenAI 5 Step AGI에 따르면 생성형AI 추론 이후 Agent서비스가 도래한다고 되어 있다. 그러나 가트너는 Agent 앞에 AI.Ready Data를 다음 단계로 제시한다.


다시 AI.Ready Data를 정의하면, "가트너가 정의하는 'AI 레디(AI-Ready) 데이터'는 특정 AI 모델과 사용 사례에 맞춰 최적화된, 고품질의 목적 적합한 데이터를 의미합니다. 이는 단순히 많은 양의 데이터를 확보하는 것을 넘어, AI가 효과적으로 학습하고 정확한 결과를 도출할 수 있도록 데이터의 준비 상태를 관리하는 것을 말한다."


글로벌 생성형AI 서비스는 이미 치열한 버전 업그레이드 경쟁 상태이고, 허깅페이스에는 수많은 파운데이션모델이 실시간으로 올라오고 있다. 이미 기업이나 정부의 입장에선 생성형AI 서비스 또는 파운데이션모델에 대한 선택의 폭은 넓고 오히려 GPU의 확보에 집중하고 있다.


생성형AI와 Agent를 효율적으로 활용하기 위하여서는 결국 내부에 보유하고 있는 데이터의 확보와 정리 그리고 AI에 활용할 수 있는 상태로 정리하고 그 연관성을 정의하는 사전 준비상태가 기업의 경쟁력으로 연결 지어진다.


여기에서 중요한 점은 2가지이다. AI가 효과적으로 학습하고 정확한 결과를 도출할 수 있는 데이터란 첫째로 "온톨로지"이고 두 번째로 "비정형 데이터를 AI 학습데이터"로 만드는 것이다.


우리가 기존까지 정립되었던 데이터와 AI 학습데이터는 그 결을 달리한다.


AI 에이전트는 AI 기술을 활용해 디지털과 물리 환경에서 인지하고 의사결정을 내리며 행동을 수행해 목표를 달성하는 자율 또는 반자율 소프트웨어다. 여기서 AI Agent가 역할을 할려면 첫째 경량화된 sLLM모델이 있어야 하고 두번째로 업무에 대한 명확한 정의 세번째로 Agent를 사용하는 사용구성원에 대한 정의 네번째로 목표 달성을 위한 데이터의 정의가 정립되어야 한다.

여기서 데이터와 조직 그리고 업무 프로세스는 온톨로지로 정의될 수 있고, 우리 업무에 활용되는 문서 데이터 외에 비정형데이터 그리고 실시간 데이터는 매개변수(패러미터)로 정의가 될 수 있다.


지금의 생성형AI 서비스에서 진정한 Agent로 넘어갈려면 데이터 온톨로지와 비정형 데이터의 매개변수(패러미터) 정의가 필수 선결과제다.


keyword
매거진의 이전글02. 환각[할루시네이션]