brunch

생성형 AI시대와 Machine Readable

by 점선면

생성형 AI 시대에 Machine Readable의 필요성에 대한 논쟁은 중요한 주제이다. 일부 전문가들은 생성형 AI가 PDF 파일이나 이미지 파일과 같은 비정형 데이터도 읽고 이해할 수 있는 능력을 갖추게 되면서 Machine Readable의 중요성이 감소할 수 있다고 주장한다. 이러한 주장을 뒷받침하는 몇 가지 근거는 다음과 같다.
첫째 생성형 AI의 발전이다. 최근 생성형 AI는 텍스트뿐만 아니라 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 처리할 수 있는 멀티모달 능력을 갖추고 있다. 이를 통해 PDF 파일이나 이미지 파일에 포함된 텍스트와 이미지 정보를 동시에 이해하고 분석할 수 있다.
둘째, 컴퓨터 비전 기술과 OCR(광학 문자 인식) 기술의 발전으로 이미지를 분석하고 텍스트를 추출하는 능력이 향상되었다. 이를 통해 이미지 파일이나 PDF 파일에서 텍스트 정보를 추출하여 생성형 AI가 활용할 수 있도록 만들 수 있다.
셋째는 Machine Readable의 한계때문이다. 현실 세계의 데이터는 다양한 형식으로 존재하며, 모든 데이터를 Machine Readable 형식으로 변환하는 것은 시간과 비용이 많이 소요되는 작업이다.
PDF 파일이나 이미지 파일과 같이 비정형 데이터는 Machine Readable 형식으로 변환하기 어렵거나 불가능한 경우가 많다.

그럼에도 Machine Readable은 몇가지 측면에서 여전히 중요하다.
첫째 데이터 처리의 효율성 측면이다. Machine Readable 형식의 데이터는 생성형 AI가 훨씬 빠르고 정확하게 처리할 수 있다. 특히. 대규모 데이터를 처리해야 하는 경우 Machine Readable의 효율성은 더욱 중요해진다.
둘째 데이터의 구조화 측면이다. Machine Readable 형식은 데이터를 구조화하여 표현하므로, 생성형 AI가 데이터 간의 관계를 파악하고 논리적인 추론을 수행하는 데 도움을 준다. 이는 생성형 AI의 성능 향상에 기여합니다.
셋째 데이터의 상호 운용성 측면이다. Machine Readable 형식은 다양한 시스템과 애플리케이션 간의 데이터 교환 및 공유를 용이하게 합니다. 이는 데이터 활용의 효율성을 높이고 새로운 서비스 및 애플리케이션 개발을 촉진합니다.

생성형 AI의 발전으로 비정형 데이터 처리 능력이 향상되었지만, Machine Readable은 여전히 중요한 역할을 한다고 생각한다. 특히 대규모 데이터 처리, 데이터의 구조화, 데이터의 상호 운용성 측면에서 Machine Readable은 생성형 AI 시대의 핵심적인 기반 기술이다. 따라서 생성형 AI 시대에는 비정형 데이터 처리 기술과 Machine Readable 기술이 상호 보완적으로 발전해야 한다.

keyword
작가의 이전글디지털 전환시대의 접근법