공공데이터 활용 with AI

by 마경근

AI가 코딩하는 시대, 공공데이터 활용에서 사람의 역할은 무엇인가?

AI가 사람보다 코딩을 더 잘하는 시대가 왔다. 이 문장이 불편하게 느껴진다면, 아마 아직 AI와 함께 코딩해본 경험이 많지 않아서일 것이다. 실제로 AI 코딩 에이전트를 써본 사람이라면 고개를 끄덕일 수밖에 없다.

그렇다면 질문이 달라져야 한다. "AI가 코딩을 잘한다면, 사람은 무엇을 해야 하는가?"

내 답은 이렇다. 사람은 숲을 보고, AI는 나무를 다듬는다.

사람은 기획, 데이터 흐름 설계, 아키텍처 정의 등 전체 그림을 그리는 일에 집중해야 한다. 반면 AI는 데이터 수집, 전처리, 반복적인 코딩 작업처럼 구체적이고 손이 많이 가는 일을 맡는다. 이 역할 분담이 자리를 잡을 때, 개발은 훨씬 빠르고 단단해진다.


이 생각을 직접 실험해봤다

말로만 하면 공허하다. 그래서 직접 만들어봤다.

부동산 실거래가 데이터를 중심으로 '아파트 거래 인사이트 채팅 시스템' 을 개발하고, 그 전 과정을 위키독스에 기록했다.

https://wikidocs.net/book/19526


파이썬 기본 문법을 아는 사람이라면 누구든 따라올 수 있다. 코드를 한 줄 한 줄 완전히 이해하지 않아도 괜찮다. 시스템의 흐름을 파악하고, 지침 파일(CLAUDE.md)과 프롬프트를 잘 작성하는 것만으로도 실제로 동작하는 시스템을 만들 수 있다는 것을 보여주고 싶었다.


시스템 구조는 이렇다

시스템은 크게 두 개의 섹션으로 구성된다.

하나는 데이터 파이프라인 — 국토교통부 실거래가 API와 네이버 매물 데이터를 수집하고, 정제하여 데이터베이스에 적재하는 흐름이다. 또 하나는 AI 에이전트 — 쌓인 데이터를 바탕으로 사용자의 질문에 답하고, 인사이트를 도출하는 LLM 기반 채팅 인터페이스다.

system-architecture.png

실제로 이런 화면을 만날 수 있다

시스템이 완성되면 아래와 같은 결과를 확인할 수 있다.

첫 번째 화면은 실거래가 데이터와 네이버 매물 데이터를 결합하여 LLM이 종합 분석한 결과다. 같은 단지, 같은 면적이라도 실제 거래 가격과 현재 호가 사이의 괴리를 한눈에 파악할 수 있다.

chainlit_01.png


두 번째 화면은 실거래가 데이터와 PDF 문서를 결합한 결과다. 정책 보고서나 시장 분석 자료를 함께 참조하면, 단순한 가격 데이터가 맥락 있는 인사이트로 변환된다.

chainlit_02.png

가능성을 타진한 결과물

위키독스에 정리한 이 도서는 완성된 정답이 아니다. 'AI 시대에 공공데이터를 어떻게 활용할 수 있는가' 에 대한 하나의 실험이자, 가능성을 직접 손으로 확인한 기록이다.

데이터 소스는 더 다양하게 확장할 수 있고, 에이전트의 역할도 더 정교해질 수 있다. 공공데이터는 무궁무진하고, AI 도구는 매달 더 강력해지고 있다. 이 조합이 만들어낼 가능성은 아직 시작에 불과하다.

숲을 설계하는 사람 한 명과 나무를 다듬는 AI가 함께라면, 생각보다 훨씬 많은 것을 만들 수 있다.

작가의 이전글AI 시대, 공공데이터 활용 진화 단계