AI 시대에 기업이 온톨로지를 다시 보는 이유
AI 이야기를 조금만 하다 보면 어느 순간 이런 단어가 튀어나온다.
온톨로지.
처음 들으면 대부분 반응이 비슷하다.
“아… 또 어려운 말 나왔다.”
맞다. 이름은 좀 어렵다.
그런데 개념 자체는 생각보다 단순하다.
그리고 지금 AI 시대에 다시 중요해진 이유도 꽤 명확하다.
온톨로지라는 단어는 원래 철학에서 왔다.
철학에서 온톨로지는 이런 질문을 다룬다.
세상에는 무엇이 존재하는가?
사람이 있고, 도시가 있고, 동물이 있고, 음식이 있다.
그리고 이런 것들은 서로 어떤 관계를 가진다.
예를 들어 사람은 도시에 살고,
도시는 나라 안에 있고,
동물은 생물이라는 더 큰 범주 안에 들어간다.
이런 “세상 구조”를 정리하는 것이 철학에서 말하는 온톨로지다.
컴퓨터 과학에서 말하는 온톨로지는 이 아이디어를 그대로 가져온 것이다.
단어만 바뀐다.
사람들이 세상을 이해하는 방식
그걸 컴퓨터도 이해하게 만들 수 있을까?
이 질문에서 시작한다.
그래서 컴퓨터에서의 온톨로지는 이렇게 설명할 수 있다.
사람들이 공유하는 상식과 개념 구조를컴퓨터가 이해할 수 있게 정리한 모델.
예를 하나 들어보자.
“김치”라는 단어가 있다.
사람은 김치를 보면 바로 몇 가지를 안다.
김치는 음식이다.
발효 식품이다.
한국 음식이다.
채소로 만든다.
이건 한국 문화권에서 거의 누구나 공유하는 상식이다.
그런데 컴퓨터는 이런 걸 모른다.
요즘 많이 쓰는 LLM도 사실 정확히 아는 건 아니다.
LLM은 보통 이런 식으로 작동한다.
김치라는 단어가 어떤 단어들과 자주 같이 등장하는지 계산한다.
김치 옆에 발효, 음식, 한국 같은 단어가 자주 나오면
그 패턴을 기반으로 문장을 만들어낸다.
그래서 대부분의 경우 맞는 말을 한다.
하지만 개념 자체를 이해하고 있는 것은 아니다.
온톨로지는 이걸 다르게 표현한다.
온톨로지에서는 김치를 단순한 단어로 보지 않는다.
김치는 음식이라는 개념에 속한다.
그리고 발효식품이라는 분류에도 속한다.
또 한국 음식이라는 문화적 범주에도 속한다.
그리고 이런 관계도 같이 정리한다.
김치는 채소를 재료로 만든다.
김치는 발효라는 과정을 거친다.
이렇게 되면 김치는 그냥 텍스트가 아니라
개념과 관계 속에서 정의된 존재가 된다.
이 차이가 꽤 중요하다.
LLM은 단어 패턴을 잘 다루는 시스템이다.
온톨로지는 그 단어가 무슨 의미인지 정리하는 구조다.
쉽게 말하면 이렇다.
LLM은 말을 잘한다.
온톨로지는 그 말이 무슨 뜻인지 정리한다.
이 개념이 요즘 다시 등장한 이유는 AI의 역할이 바뀌었기 때문이다.
예전의 AI는 주로 이런 일을 했다.
문장을 생성한다.
검색을 도와준다.
요약을 한다.
데이터가 조금 틀려도 큰 문제가 되지 않았다.
결과가 조금 이상하게 나오는 정도였다.
그래서 이런 말이 있었다.
Garbage In, Garbage Out.
쓰레기 데이터를 넣으면
쓰레기 결과가 나온다는 뜻이다.
그 정도였다.
그런데 지금은 상황이 다르다.
AI는 점점 더 많은 일을 직접 한다.
데이터를 분석하고,
판단을 내리고,
다른 시스템을 호출하고,
자동화를 실행하기도 한다.
예를 들어 이런 상황을 생각해 보자.
AI가 회사 재고 데이터를 보고
자동으로 주문을 넣는 시스템이 있다고 하자.
그런데 재고 기준이 잘못 입력되어 있다.
어떤 시스템에서는 재고 부족이라고 판단하고
어떤 시스템에서는 충분하다고 판단한다.
이 상태에서 AI가 자동 주문을 시작하면 어떻게 될까?
단순한 오류가 아니라
운영 사고가 된다.
그래서 요즘은 이런 표현이 나온다.
Garbage In, Disaster Out.
잘못된 데이터가
재앙으로 이어질 수 있다는 뜻이다.
여기서 기업들이 다시 고민하기 시작한 것이 바로 온톨로지다.
기업에는 수많은 데이터가 있다.
고객 데이터
제품 데이터
주문 데이터
재고 데이터
문제는 이런 데이터들이
각 시스템마다 다른 의미로 사용되는 경우가 많다는 것이다.
예를 들어 “고객”이라는 단어 하나만 해도
마케팅 시스템에서 말하는 고객
결제 시스템에서 말하는 고객
CRM에서 말하는 고객
전부 기준이 다를 수 있다.
사람이 보기에는 같은 단어지만
시스템에서는 서로 다른 개념이 된다.
이 상태에서 AI에게 판단을 맡기면
문제가 생길 수밖에 없다.
그래서 필요한 것이
개념을 명확하게 정의하는 구조다.
온톨로지는 바로 그 역할을 한다.
많은 사람들이 온톨로지를 이렇게 생각한다.
AI 성능을 올리는 기술.
뭔가 마법처럼 정확도를 높여주는 방법.
하지만 기업 환경에서는 조금 다르게 보는 것이 맞다.
온톨로지는 성능 기술이라기보다
가드레일에 가깝다.
AI가 조직 안에서
엉뚱한 판단을 하지 않도록 막아주는 구조다.
개념을 정의하고,
관계를 정리하고,
기준을 명시한다.
그러면 AI는 그 구조 안에서 움직인다.
그래서 AI 시대에 중요한 질문은 이것이다.
데이터가 얼마나 많은가?
이 질문보다 더 중요한 것이 있다.
그 데이터가 무엇을 의미하는가.
온톨로지는 바로 그 질문에 대한 답이다.