온톨로지(Ontology) 구축 방법론

실무에서 마주한 Agentic AI의 한계와 온톨로지의 역할

by 정경문

AI 기술의 눈부신 발전에도 불구하고, 저 스스로는 연구원으로서 2024년과 2025년 동안 생성형 AI, RAG, Agentic AI를 연구하며 많은 한계와 어려움을 마주했습니다. 이는 아마 저자 만의 문제가 아닐 것이라고 생각합니다. 그 끝에서 다시 주목받고 있는 온톨로지(Ontology)와 디지털 트윈(Digital Twin)이라는 개념을 통해 잠시 생각의 정거장을 만났고, 시작은 있었지만 끝을 알 수 없는 공부를 계속 이어가고 있습니다. 이 글은 그 과정에서 마주한 선구자들의 지식과 경험, 논문들을 정리한 기록입니다.


왜 온톨로지(Ontology)를 만들어야 하는가?


대표적 온톨로지 이론으로 2001년 스탠퍼드대학교에서 진행된 연구 'Ontology Development 101: A Guide to Creating Your First Ontology'를 소개하겠습니다. “왜 온톨로지를 만들어야 하는가?”라는 질문에서 출발해 처음 온톨로지를 구축하는 사람도 따라 할 수 있는 실무 중심의 방법론을 제시하는데요. 논문 제목에 사용된 ‘101’은 미국 대학에서 입문 과목 번호를 관습적으로 ‘101’로 붙이는 전통에서 유래한 것이죠. 스탠퍼드의 Ontology Development 101에서는 온톨로지 구축을 다음 7단계로 진행하도록 제안합니다.

image.png
온톨로지의 도메인과 범위를 결정한다.
(온톨로지가 다루게 될 도메인은 무엇인가? 무엇에 사용하는가?)
기존 온톨로지의 재사용을 고려한다.
(표준화된 온톨로지 언어로 호환한다)
온톨로지에 포함될 중요한 용어를 나열한다.
(사용자가 설명하고 싶은 모든 용어 목록 작성)
클래스와 클래스 계층 구조를 정의한다.
(예시: Top-down, Bottom-up, Middle-out)
클래스의 속성을 정의한다.
(예시: 사람으로 따지면 거주지, 나이, 성별 등)
속성이 가질 수 있는 값의 특징을 설명한다.
(예시: 허용되는 데이터의 유형 - 문자, 숫자 등)
인스턴스를 생성한다.
(속성값을 가진 고유의 객체를 만든다. "홍길동"이라는 고유의 인물)


어떤 도메인을 모델링하는 "유일하게 옳은" 방법은 없습니다. 항상 여러 가지 실행 가능한 대안이 존재하죠. 가장 좋은 해법은 거의 항상, 여러분이 염두에 두고 있는 애플리케이션과 앞으로 예상되는 확장 방향에 따라 달라지게 됩니다. 온톨로지 개발은 본질적으로 반복적인 과정입니다. 온톨로지에 포함되는 개념들은, 관심 도메인 내의 객체(물리적 객체이든 논리적 객체이든)와 그들 사이의 관계에 가깝게 정의되어야 합니다. 이들은 해당 도메인을 설명하는 문장에서 주로 명사(객체)와 동사(관계)로 등장하는 것들 입니다.

온톨로지는 클래스(Class) → 속성(Property) → 관계(Relation) → 제약조건(Facet) → 인스턴스(Instance) 순서로 구성되며, Top-down, Bottom-up, Middle-out 방식으로 구조를 설계할 수 있습니다.

상향식(Top-down) 개발 과정은 도메인에서 가장 일반적인 개념부터 정의하고, 이후 점점 세분화하는 방식입니다. 하향식(Bottom-up) 개발 과정은 가장 구체적인 클래스들, 즉 계층 구조의 잎(leaf)에 위치한 클래스들부터 정의하고, 이후 이들을 점차 더 일반적인 개념으로 묶어가는 방식입니다. 혼합(Combination) 개발 과정은 상향식과 하향식 방식을 결합한 것입니다. 먼저 눈에 띄는 주요 개념들을 정의한 뒤, 이를 적절히 일반화하거나 세분화하는 방식입니다.


2. 온톨로지 언어


지금 바로 작가의 멤버십 구독자가 되어
멤버십 특별 연재 콘텐츠를 모두 만나 보세요.

brunch membership
정경문작가님의 멤버십을 시작해 보세요!

"나는 처세술 대신 데이터 분석을 택했다" 저자. 데이터와 삶의 깨달음에 대해 쓰고, 데이터는 모두에게 동등한 기회를 제공하는가에 답하며 살아갑니다. Data Scientist

2,744 구독자

오직 멤버십 구독자만 볼 수 있는,
이 작가의 특별 연재 콘텐츠

  • 총 9개의 혜택 콘텐츠
최신 발행글 더보기
이전 06화AI시대 조직과 산업의 온톨로지가 중요한 이유