brunch

You can make anything
by writing

C.S.Lewis

by 솔론 Oct 06. 2024

도메인 선정 및 요구사항 분석

지식그래프 구축 단계

지식 그래프나 온톨로지를 구축할 때 첫 번째 단계는 도메인을 선정하고, 그 도메인 내에서 필요한 요구사항을 분석하는 것입니다. 도메인은 지식 그래프가 다룰 특정 주제나 분야를 의미하며, 이 도메인을 명확하게 정의해야 온톨로지를 통해 해결할 문제나 제공할 정보를 제대로 구조화할 수 있습니다. 이 과정에서 고려해야 할 여러 요소와 구체적인 예시를 살펴보겠습니다.





1. 도메인 선정

도메인 선정은 지식 그래프나 온톨로지가 다루어야 할 주제나 분야를 정하는 과정입니다. 어떤 도메인을 선택하느냐에 따라 데이터의 범위와 복잡성, 사용자가 필요로 하는 정보가 달라지기 때문에, 이 단계에서 신중한 결정이 필요합니다.


예를 들어, 도서관의 서적 관리 시스템을 위한 지식 그래프를 구축하려면, 도메인은 문헌 정보나 서적 분류 체계가 될 수 있습니다. 여기서 다루는 정보는 책의 제목, 저자, 출판사, 출판 연도, 장르 등의 속성일 것입니다. 이 도메인은 서적 관련 정보를 체계적으로 관리하는 것을 목표로 합니다.


또 다른 예시로는 의료 분야에서 지식 그래프를 구축하는 경우가 있습니다. 이때 도메인은 질병, 환자 정보, 치료 방법과 같은 주제가 될 수 있습니다. 의료 도메인을 선택하면, 환자의 증상, 진단, 치료 과정에 관련된 데이터를 구조화하고, 질병 간의 관계나 증상과 치료법 간의 상관관계를 온톨로지를 통해 표현하게 됩니다.



2. 주요 개체와 속성 정의

도메인을 선정한 후에는 그 도메인 내에서 주요 개체와 속성을 정의해야 합니다. 이는 지식 그래프에서 어떤 개념들을 중심으로 데이터를 구성할지를 결정하는 중요한 과정입니다.


예를 들어, 도서관 서적 관리 도메인을 선택했다면, 주요 개체는 '책', '저자', '출판사'와 같은 항목이 될 수 있습니다. 각각의 개체는 고유한 속성을 가집니다. 예를 들어, '책' 개체는 제목, 출판 연도, ISBN 등의 속성을 가질 수 있고, '저자'는 이름, 출생 연도, 국적과 같은 속성을 가질 수 있습니다.


또 다른 예시로는 의료 도메인을 생각해볼 수 있습니다. 이 경우 '환자', '질병', '치료법' 등이 주요 개체로 등장할 수 있습니다. '환자'는 이름, 나이, 성별, 병력 등의 속성을 가질 수 있고, '질병'은 증상, 발병 원인, 치료 방법 등의 속성을 가질 수 있습니다.


이 단계에서 각 개체가 가진 속성을 명확하게 정의해야만 나중에 지식 그래프가 일관성 있게 구성될 수 있습니다.



3. 요구사항 분석

도메인을 선정하고 개체와 속성을 정의한 후에는 요구사항을 분석하는 과정이 필요합니다. 이 단계는 온톨로지나 지식 그래프를 구축하는 목적을 명확히 하고, 시스템이 어떤 문제를 해결해야 하는지 또는 어떤 정보를 제공해야 하는지를 정의하는 과정입니다.


예를 들어, 도서관 시스템에서 책을 대출하는 기능을 추가하려 한다면, 사용자가 어떤 정보가 필요할지를 고려해야 합니다. 사용자는 책의 대출 가능 여부, 반납 예정일, 현재 대출 중인 사용자의 정보 등을 원할 수 있습니다. 이처럼 도서관 시스템의 요구사항은 단순히 서적 정보를 나열하는 것을 넘어서, 대출 상태 관리와 이용자 관리가 포함될 수 있습니다.


의료 도메인에서도 마찬가지입니다. 의료 시스템의 지식 그래프를 구축할 때는 환자의 병력 관리나 치료 경과 추적이 요구사항일 수 있습니다. 환자가 진료를 받았을 때, 의사는 환자의 이전 병력과 진단 기록을 빠르게 조회해야 하고, 현재의 증상에 따라 가능한 치료법을 추천받을 수 있어야 합니다. 이와 같은 요구사항을 분석해 지식 그래프가 어떤 정보를 저장하고 제공해야 하는지 구체화할 수 있습니다.



4. 요구사항의 우선순위 설정

요구사항이 분석되었다면, 우선순위를 설정하는 것이 중요합니다. 모든 기능을 한꺼번에 구현하려고 하면 프로젝트의 복잡성이 커지고, 시간이 오래 걸릴 수 있기 때문입니다. 따라서 지식 그래프 구축 시, 가장 중요한 기능부터 우선적으로 설계하고, 나중에 확장할 수 있도록 설계하는 것이 좋습니다.


예를 들어, 도서관 시스템에서 서적의 기본 정보(제목, 저자, 출판사 등)를 먼저 구축하고, 그 후에 대출 정보나 사용자의 서평 등 부가 기능을 추가할 수 있습니다. 이렇게 하면 초기 단계에서 핵심 기능을 빠르게 구현하고, 이후에 필요에 따라 시스템을 확장할 수 있습니다.


의료 시스템에서도 우선 환자의 기본 정보와 진단 기록을 먼저 구조화하고, 그 다음에 치료 경과나 증상 간의 복잡한 관계를 추가하는 방식으로 지식 그래프를 점진적으로 확장할 수 있습니다.



5. 이해관계자와의 협력

도메인 선정과 요구사항 분석은 이해관계자와의 협력이 필수적입니다. 이해관계자는 온톨로지나 지식 그래프가 구축될 분야에서 직접 데이터를 사용할 사람들로, 이들의 요구사항과 목표를 정확히 파악하는 것이 성공적인 시스템 구축의 열쇠입니다.


예를 들어, 도서관 시스템을 구축할 때는 도서관 사서나 관리자가 주된 이해관계자가 될 수 있습니다. 이들은 책의 분류 체계와 대출 관리의 복잡성을 잘 이해하고 있으므로, 그들의 의견을 반영해 도서관 업무에 실제로 도움이 되는 시스템을 설계할 수 있습니다.


의료 시스템에서는 의사나 간호사, 병원 관리자와 협력하여, 의료 정보가 어떻게 제공되고 관리되어야 할지를 결정해야 합니다. 그들의 피드백을 반영해 시스템이 실제 현장에서 사용되기 적합하도록 설계하는 것이 매우 중요합니다.

작가의 이전글 온톨로지 언어 선택하기
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari