여섯 가지 기술 영역으로 보는
AI 구조

생성형 AI라는 말 너머의 기술들

by 분석과통찰

AI 기술 카탈로그

생성형 AI라는 표현 너머를 봐야 하는 이유

우리는 ChatGPT나 클로드 같은 서비스를 흔히 "생성형 AI"라고 부릅니다. 조금 더 기술적인 맥락에서는 "LLM(Large Language Model)"이라고 부르기도 하죠. 그런데 이 표현들이 정말 적절한 걸까요?


"생성형 AI"라는 말에는 이 기술이 무언가를 창의적으로 만들어낸다는 인상이 담겨 있습니다. "AI 어시스턴트"라는 말에는 인간처럼 대화하고 판단하는 존재라는 뉘앙스가 있죠. 반면 LLM은 뜻 그대로 하면 "대규모 언어 모델"입니다. 이 세 가지 표현 중 가장 정직한 건 LLM이에요. 이 기술이 실제로 하는 일을 단순하게 설명하면 "다음에 올 가장 그럴듯한 단어를 확률적으로 예측하는 것"에 가깝거든요. 이해하는 게 아니라 패턴을 따르는 겁니다.


그렇다면 왜 인간화된 표현이 굳어졌을까요. 두 가지 이유가 있습니다. 하나는 마케팅입니다. "토큰 예측기"보다 "AI 어시스턴트"가 훨씬 잘 팔리니까요. 다른 하나는 출력 형태 때문입니다. 결과물이 자연어 문장으로 나오다 보니, 사람들이 자연스럽게 대화 상대로 인식하게 되는 거예요. 스프레드시트가 숫자를 뱉으면 도구로 보는데, 같은 논리가 여기선 작동하지 않는 겁니다.


이것이 왜 중요하냐면, AI를 어떻게 인식하느냐가 조직이 AI를 어떻게 도입하고 활용하느냐에 직접 영향을 미치기 때문입니다. "뭐든 물어볼 수 있는 존재"로 보면 챗봇 하나 붙이는 수준의 도입이 되고, "확률적 패턴 생성기"로 정확하게 이해하면 어디에 쓰고 어디엔 쓰지 말아야 할지가 훨씬 명확해집니다.


"생성형 AI" 너머에 있는 것들

그렇다면 우리가 흔히 "생성형 AI 도입"이라고 뭉뚱그려 부르는 것의 안을 들여다보면 실제로는 어떤 기술들이 있을까요. 특정 기관이나 기업이 목적을 달성하기 위해 필요한 AI 기술들을 정리하면 크게 여섯 가지 카테고리로 나눌 수 있습니다.


첫 번째는 입력 처리 기술입니다. 데이터를 AI가 다룰 수 있는 형태로 변환하는 영역이에요. 이미지나 스캔 문서에서 텍스트를 추출하는 OCR, PDF나 HWP 같은 문서에서 표와 본문 구조를 정확하게 뽑아내는 문서 파싱(Document Parsing), 음성을 텍스트로 변환하는 STT, 이미지와 영상을 인식하는 컴퓨터 비전이 여기에 해당합니다. 공공기관은 오랫동안 종이 문서와 팩스 기반 행정을 해왔기 때문에 이 영역이 특히 중요합니다.

OCR — 이미지·스캔 문서에서 텍스트 추출. 공공기관에서 특히 중요 (종이 문서, 팩스 기반 행정)

Document Parsing — PDF, Word, HWP 등 구조화된 문서에서 표·헤더·본문을 구조적으로 추출. OCR과는 다른 영역

STT (Speech to Text) — 음성을 텍스트로. 회의록 자동화, 콜센터 분석 등에 사용

Computer Vision — 이미지·영상 인식. 시설물 점검, 불법 주정차 감지 등 공공 적용사례 다수




두 번째는 지식 구조화 기술입니다. 흩어진 정보를 AI가 활용할 수 있게 정리하는 영역이에요. 텍스트를 숫자 벡터로 변환해서 의미 기반 검색을 가능하게 하는 임베딩(Embedding), 그 벡터를 저장하고 유사도 검색을 하는 벡터 데이터베이스(Vector DB), 개념 간 관계를 구조화하는 지식 그래프(Knowledge Graph), 키워드 기반의 전통적인 전문 검색이 여기에 속합니다. 좋은 AI 서비스의 대부분은 이 지식 구조화가 얼마나 잘 되어 있느냐에서 품질이 결정됩니다.

Embedding — 텍스트를 숫자 벡터로 변환. 의미 기반 검색의 핵심 엔진

Vector DB — 임베딩된 정보를 저장하고 유사도 검색. Pinecone, Weaviate, Chroma 등

Knowledge Graph — 개념 간 관계를 구조화. 법령 체계, 조직 관계도 등에 적합

Full-text Search — 키워드 기반 전통적 검색. Elasticsearch 등. 시맨틱 검색과 병행하는 경우 많음




세 번째가 우리가 보통 "생성형 AI"라고 부르는 핵심 AI 엔진입니다. LLM 자체가 여기 해당하고, LLM에 검색을 결합해서 기관 내부 문서 기반으로 답변하게 하는 RAG(Retrieval Augmented Generation), 특정 도메인 데이터로 모델을 추가 학습시키는 파인튜닝(Fine-tuning), 문서에서 인물·날짜·금액 등을 자동으로 태깅하는 개체명 인식(NER), 문서를 카테고리로 분류하는 분류(Classification), 긴 문서를 요약하는 요약(Summarization) 등이 포함됩니다.

RAG (Retrieval Augmented Generation) — LLM + 검색의 결합. "우리 기관 문서 기반으로 답변"이 필요할 때. 환각(hallucination) 억제에 핵심적

Fine-tuning — 특정 도메인 데이터로 모델을 추가 학습. 전문 용어, 기관 특유 문체 등에 적응

NER (Named Entity Recognition) — 문서에서 인물·기관·날짜·금액 등을 자동 태깅

Classification — 텍스트를 카테고리로 분류. 민원 유형 분류, 문서 자동 배분 등

Summarization — 긴 문서를 요약. 회의록, 보고서, 법령 등

Translation — 다국어 번역. 국제 협력 기관, 외국인 대상 서비스



네 번째는 생성·출력 기술입니다. LLM의 텍스트 생성 외에도 이미지 생성, 텍스트를 음성으로 변환하는 TTS, 코드 자동 생성, 그리고 JSON이나 표 같은 정형 데이터로 출력하는 구조화 출력(Structured Output)이 여기에 해당합니다. 시스템 간 연계를 위해서는 특히 구조화 출력이 중요합니다.

Text Generation — LLM의 기본 출력. 초안 작성, 응답 생성 등

Image Generation — Diffusion 모델 계열 (Stable Diffusion, DALL-E 등). 공공에서는 아직 제한적

TTS (Text to Speech) — 텍스트를 음성으로. 민원 안내, 접근성 서비스

Code Generation — 코드 자동 생성·리뷰. 내부 시스템 개발 보조

Structured Output — JSON, 표, 양식 등 정형 데이터로 출력. 시스템 연계에 필수




다섯 번째는 에이전트·자동화 기술입니다. 최근 가장 빠르게 발전하는 영역이에요. AI가 스스로 도구를 선택하고 여러 단계를 수행하는 AI 에이전트, AI가 외부 시스템을 직접 호출하는 함수 호출(Function Calling), 여러 AI가 역할을 분담해서 협업하는 멀티에이전트, RPA와 AI가 결합된 업무 자동화가 여기에 속합니다. 단순한 Q&A를 넘어 실제 업무 프로세스 자동화로 나아가는 핵심 기술들입니다.


AI Agent — LLM이 스스로 도구를 선택하고 여러 단계를 수행. 단순 Q&A를 넘어 업무 자동화로

Function Calling / Tool Use — AI가 외부 시스템(DB, API, 캘린더 등)을 직접 호출

Multi-agent — 여러 AI가 역할 분담해서 협업. 복잡한 업무 프로세스에 대응

Workflow Automation — RPA와 AI의 결합. 반복 행정 업무 자동화




여섯 번째는 운영·거버넌스 기술입니다. AI 출력을 필터링하고 제어하는 가드레일(Guardrails), AI 답변의 오류를 탐지하는 환각 탐지, 사용 이력과 품질을 추적하는 모니터링·로깅, 모델 선택과 캐싱을 통한 비용 최적화가 여기에 해당합니다. 공공감사 대응과 예산 제약이 있는 공공기관에서 특히 실질적인 의미를 갖는 영역입니다.


Guardrails — 출력 내용 필터링·제어. 유해 콘텐츠, 개인정보, 기관 정책 위반 방지

Hallucination Detection — AI 답변의 사실 오류 탐지

모니터링·로깅 — AI 사용 이력, 품질 추적. 공공감사 대응에 중요

비용 최적화 — 모델 선택, 캐싱, 배치 처리 등. 예산 제약 있는 공공기관에 실질적 이슈


다음글 부터는 이 여섯 가지 카테고리를 하나씩 다뤄보려 합니다. AI 도입을 검토하든, AX 전환을 설계하든, 각 기술이 실제로 무엇을 하는 것인지에 대한 기초적인 이해는 반드시 필요하기 때문입니다. 어떤 문제를 해결하고 싶은지를 먼저 알아야, 어떤 기술을 골라야 할지를 판단할 수 있습니다.

월요일 연재
이전 09화AI 도입과 AX 전환