brunch

정부기관의 생성형 AI 도입 가능성에 대한 이야기

by 테오리아

1.최근 경찰청에서 AI 사용 시 주의사항에 대한 공문을 하달함


20,30대 젊은 경찰관 중심으로 업무에 활용 사례가 증가했다고 함

우려스러운 점은 민감정보를 취급하는 기관이다 보니 개인정보나 수사기밀 유출 위험이 있음

수사 내용이 담긴 일부 문단이나 문장을 챗 GPT 돌리면 외부 서버에 정보가 쌓여 유출이 가능함

개선책으로 경찰청은 LG의 AI 모델 엑사원 활용하여 자체 내부망에서 운영할 수 있는 AI 모델 구축 계획하고 있음

image.png?type=w773




2.정부, 공기업의 데이터 관리는 굉장히 보수적임


정부는 국민의 알 권리 및 투명성 제고 차원에서 정보공개 제도를 통해 데이터 공시를 의무화하고 있으며 공개 범위를 늘리고 있음

공개 범위는 업무추진비, 계약, 내부 규정, 이사회 의결, 채용, 예산, 결산 등


반면, 개인정보나 민감정보에 대해서는 매우 보수적으로 대응하고 있음

대표적인 대응방법으로 망분리를 이야기할 수 있음

공무원들은 정보 유출을 원천적으로 차단하기 위해 업무용 PC와 인터넷용 PC를 따로 사용함

모니터가 두 대가 아니라 정말 본체 두 대를 사용함




3.국가/공공기관 등에는 물리적 망분리, 금융기관은 논리적 망분리를 사용하고 있음


image.png?type=w773


물리적 망분리는 쉽게 말해 업무용 PC와 인터넷용 외부 네트워크용 PC를 따로 지급하는 방식(주로 정부기관)

별다른 기술 없이도 쉽게 망분리 가능하여 완벽에 가까운 보안을 자랑함

= 직원별로 업무용 PC와 내부용 PC를 2대씩 써야 해서 비용도 2배

가성비는 떨어져도 노력 대비 보안 성능은 최고임

외부망과 단절되어 원격, 재택근무 제한, 클라우드 이용 불가 등 업무 효율과 대비되는 단점


논리적 망분리는 VMWare 등 가상머신을 사용하는 망분리 방식(주로 금융기관)

*VMWare(Virtual Machine) : 한 대의 물리적인 서버나 컴퓨터에서 여러 운영체제 실행


인터넷망과 행망 분리가 얼마나 불편하냐면 물리적으로 PC 2대를 사용하므로 챗 GPT에서 검색을 하고 결괏값을 그대로 복붙을 할 수가 없음

카톡도 사용할 수 없어서 검색 자료를 쉽게 주고받을 수 없음

민감정보를 보호를 위해 공무원들은 시대를 제대로 역행하는 상황이 돼버림


image.png?type=w773


웃프게도 보안은 신경 써야 하고 데이터를 편하게 주고받아야 하니 공무원들은 텔레그램을 사용함

행망에서 과장 승인을 받아 파일을 USB에 옮긴 다음, 인터넷망에 자료를 다시 옮겨서 외부 이메일로 보낸 다음, 자료를 다운 받아 텔레그램에 업로드하는 방식임

뉴스 기사에 따르면 업무용은 텔레그램, 소통은 카톡이라고 함

이들은 정말 역행하고 있음




4.윤석열 정부는 망분리의 불편함 해소를 위해 공무원 노트북 도입 계획을 발표함


image.png?type=w773


바로 온북이라는 건데 윤석열 정부의 국정과제 중 한 가지임

노트북으로 업무망과 인터넷망을 동시에 사용할 수 있게 한다는 의도인데 쉽게 말하면 논리적 망분리를 노트북에서 실현하는 것


행안부는 27년까지 기존 공공기관 업무용 컴퓨터를 온북으로 90% 이상 교체하겠다고 함

행안부에서는 공무원 62만명이 온북을 사용하면 업무공간 전환 등 기회비용과 전기세 및 용지, 인쇄 절감으로 4조 5547억원의 예산절감 효과가 있다고 함

노트북 지급으로 어떻게 저 정도의 예산 절감할 수 있는지 이해할 수 없음

불행 중 다행으로 작년 망분리 관련 제도가 무려 19년 만에 완화됨




5.국정원 18년 만에 망분리 완화 선언


한 번에 전적으로 망분리를 시행하겠다는 것은 아니고 단계적으로 정책 효용이 높은 영역부터 적용하겠다는 것

국가망 보안체계(N2SF, National Network Security Framework)라는 가이드라인 발표

내용을 간단하게 요약하면 내부망 데이터를 기밀, 민감, 공개 3가지로 분류하고 중요도 별로 관리함

세부적인 내용은 하반기에 확인 가능할 것으로 보임


한국 정부의 망분리의 도입 배경은 외부 바이러스 침입에 따른 대응 결과임.

2003년 디도스 공격에 의해 인터넷망이 마비되는 경험을 하면서 정보 보안의 중요성이 강조됨

2006년 국정원이 국가정보보안기본지침을 통해 모든 공공기관은 별도의 망을 써야 한다고 규정하여

국가, 공공기관 대상 망분리 정책이 최초 시행됨.

이후 금융, 방산 등으로 확대

2017년 전 세계를 강타했던 워너크라이(WannaCry) 랜섬웨어 공격에도 국내에는 큰 피해가 적었던 것은 망분리 정책의 효과라는 전문가 의견도 있음


image.png?type=w773


금융회사 망분리는 2015년 공식화되었지만 2013년 금융전산 사고가 제도 도입의 결정적인 계기가 되었음

2013년 3월 시중은행 창구 직원의 PC가 바이러스가 감염되어 오프라인 창구가 마비되고, 또 다른 시중은행은 인터넷뱅킹 장애가 발생함




6.해외 금융기관의 경우, 보안정책을 자율적으로 선택하도록 함


미국의 경우 정보의 중요도에 따라 망 세분화에 대한 설명을 제시하고 있으나 물리적, 논리적 망분리를 시스템화 시켜야 한다는 요구사항은 없음

이는 망분리 방식에 대한 재량권을 인정하는 만큼 사고 발생 시 높은 수준의 처벌이 이루어지는 사후규제가 자리 잡고 있기 때문. 주로 금전적 제재

2016년 미국 FTC는 페이스북에 데이터 유출 사고에 대한 책임을 물어 매출의 9%에 해당하는 50억 달러를 벌금을 물림


유럽도 미국과 비슷함. 가이드라인을 제시하되 구체적인 실행방안은 재량권에 맡기고 금전적으로 강력하게 처벌하는 사후규제가 있음

소비자 피해가 발생할 경우 2천만 유로와 기업 매출의 4% 중 높은 금액을 과징금으로 부과




7.해외 정부기관들은 생성형 AI를 사용할까?


미국은 애저 클라우드를 독립 구축해 내부망에서 챗 GPT 사용

프랑스는 AI 모델인 미스트랄-7B를 기반으로 행정 간소화를 목표로 하는 챗봇 알베르를 개발

싱가포르는 공무원이 사용할 수 있는 챗 GPT 기반 AI 챗봇 비서 PAIR을 제공

image.png?type=w773




8.정부기관에서 생성형 AI 서비스는 얼마나 필요할까?


image.png?type=w773 서울시 정보소통광장


매-우 필요함. 생각보다 많은 기관들이 OpenAI에 월 구독료 내면서 사용 중임

생각보다 불필요한 일들을 많이 하는 곳이 정부기관과 공기업임

불필요한 업무들은 눈에 잘 띄지 않아 따지기도, 걷어내기도 어려움

그리고 효율성 제고 차원에서 조직진단 용역을 실시해도 업무 효율성은 잘 개선되지 않음


공적 조직의 업무 형태는 효율 보다 형식을 크게 따지는 편

예를 들어 과장급들의 내부 일정 하나 하나에도 온갖 자료들과 발표 스크립트를 다 만들어줘야 함


그리고 고연차들이 본청에 들어가면 어쩔 수 없이 일을 챙기게 되는데 반대로 사이드로 나올수록 일을 점점 안 하게 됨

업무분장을 보면 업무량이 직급에 따라 삼각형 모양 나누어짐(고연차 = 업무량 적음)

위에서 밀어낸 일들을 저연차들이 초과 달고 그냥 꾸역꾸역 함

억울하긴 한데 어차피 급여가 적으니까 초과 달고 월 수령액 올리는 거임

이런 형식적인 업무에는 AI를 활용하는 게 가장 좋음

기본적인 정보를 던져주고 context에 맞는 데이터를 뽑아내면 됨


LLM을 통해 통해 깊은 고민이 필요 없는 행정업무를 빠르게 처리할 수 있음

방대한 양의 빅 데이터 분석, 회의록 작성, 보고서 요약, 각종 시나리오 작성 등




9.최근 공기업에서 사용할 수 있다는 퍼블릭 클라우드라는 단어가 자주 들림


쉽게 말하면 정부기관이나 공기업에서 사용할 수 있도록 클라우드 보안에 대한 인증을 받은 클라우드를 제공하는 것. 이 인증을 CSAP라고 함

최근 아마존도 CSAP를 획득하면서 퍼블릭 클라우드 시장에 대한 관심을 보임

*CSAP : Cloud Security Assurance Program(한국인터넷진흥원, KISA)


image.png?type=w386
image.png?type=w386
image.png?type=w386
https://medium.com/bizsol/그림으로-쉽게-이해하는-클라우드-종류-1-a16540576c21


데이터 저장공간(서버)의 물리적 위치에 따라 온프레미스, 클라우드로 나뉨

일반 기업의 전산팀에 가보면 서버실이 있을 것임

자체적 서버를 두고 데이터를 관리하는 것을 온프레미스라고함


클라우드는 외부에 있는 데이터 저장공간을 돈을 주고 사용하는 것

이런 서비스를 제공하는 기업을 CSP(Cloud Service Provider)라고함

유지 보수도, 감가상각 처리도 알아서 하므로 법인에서 차량을 리스하는 것과 비슷한 장점이 있음

프라이빗 클라우드라는 개념이 있는데 해당 기업에서 원하는 대로 커스터마이징 해준다는 개념으로 이해하면 됨


image.png?type=w773 https://medium.com/bizsol/그림으로-쉽게-이해하는-클라우드-종류-1-a16540576c21




10.정부조직 내 AI 도입은 어떤 방법이 있을까?


최근 특정 AI 개발 기업에서 사용하는 ERP 홍보 동영상을 봤는데 내부 자료를 알아서 긁어와서 분석을 다해줬음

과거에는 정해진 툴에 데이터를 입력해야 하는 방식이면 지금은 여러 자원들을 결합하여 context에 맞는 답변을 만들어줌.

일반 기업에서는 이러한 ERP를 도입하면 되는데 정부기관과 공기업의 업무의 포커스는 보고서임


공무원들 가장 공통적으로 많이 하는 업무 행위는 기안(보고서 작성)

가장 많이 사용하는 소프트웨어는 한글

현재 정부기관은 온나라시스템라는 그룹웨어에서 전자결재를 하고 있음

2023년 한글과컴퓨터는 정부 전자문서 시스템 웹 기안기를 공급했음


image.png?type=w773


가장 간단하게 AI 시스템을 공급하는 방법은 한글 프로그램에 AI 기능을 삽입하면 됨

다시 말해, 한글 안에 API 호출 기능을 넣으면 됨(입력 -> 한글 -> AI API 서버 -> AI 응답 -> 한글)

이것이 가능하면 클라우드 SaaS 제품까지 사용을 허용한다는 뜻

*SaaS : Software as a service


간단하지만 물리적인 AI 서버는 외부에 위치하고 있기 때문에 외부에 데이터가 유출될 수 있음

입력한 문구가 외부 AI API 서버에 저장됨

*API : Applicaition Programming Interface


퍼블릭 클라우드를 사용해도 LLM 엔진을 위한 AI 서버가 외부에 있으면 결국 API 호출을 해야 하므로 대안이 아닐 수 있음

퍼블릭 클라우드를 제공하는 기업(CSP)이 자체적인 LLM 엔진을 보유하면서 퍼블릭 클라우드를 제공한다면 가능성은 있음

= 자체 LLM 엔진 + SW/솔루션 + CSAP 인증을 받은 서버 + 데이터 중요도 필터링


아니면 온프레미스에 오픈소스 LLM 또는 자체 LLM 엔진을 박은 소프트웨어를 제공하면 됨


image.png?type=w773 CSAP 인증기업 일부




11.공무원들은 사용 중인 그룹웨어(솔루션)이 바뀌면 가장 걱정하는 것이 무엇일까?


2006년에 망분리 제도가 시행되었으니 무려 19년이 지났음

2006년 28살에 9급 행정직으로 입직했다고 가정하면 현재 5급 사무관으로 주민센터나 구청에서 팀장 정도

이들이 가장 걱정하는 것은 기존 자료들이 소실되는 것과 데이터 마이그레이션

생산된 자료들이 업데이트되면서 다시 보지 않지만 안 버리고 차곡차곡 쌓아놓는 습관들이 있음 ㅎㅎ

보존연한이 지났다고 자료를 버려서 문제 생기는 것보다 낫기 때문


공무원들이 얼마나 공문서 관리에 진심이냐면 기록물 관리 법률이 있고 요건에 해당되면 전담인력과 기록물 관리를 위한 기록관도 별도로 설치해야 하며, 문서 폐기를 위해서는 심의위원회를 거쳐야 함

중요 자료는 행정박물 여부도 검토해야 함

물론 민감정보를 취급하는 정부기관이므로 중요한 것은 당연함


출력된 공문서도 많지만 보유하고 있는 전산 파일은 얼마나 많을까?

한컴으로 오랜 세월 작업했으니 한글파일(*.HWP)이 엄청나게 많겠지?

웹 기안기를 사용해도 결국 그 뿌리는 한컴..


image.png?type=w773 아시아경제-문서파쇄 장면




12.공무원들의 MUST-HAVE 한글을 만든 한컴(한글과컴퓨터)은 이러한 공무원들의 마음을 잘 이해한 듯함


지난 2월 한컴은 삼성SDS와 컨소시엄을 구성해 '국회 빅데이터 플랫폼(AI 국회)' 사업을 수주했음

AI 국회 사업의 과업기간은 단 13개월

그리고 5월에는 행안부 '2025년 지능형 업무관리 플랫폼 구축' 사업도 수주함

2025년에는 1단계로 2개의 중앙행정기관을 대상으로 시범 운영, 2026년에는 전 부처, 2027에는 전국 지자체로 확대할 계획임

70만 명의 공무원들을 대상으로 확대한다고 생각하면 캡티브로 발생하는 물량이 엄청남


AI 국회 용역 제안요청서를 봤는데 모든 주요 정부기관들의 데이터를 취합하고 재생산하여 사용할 수 있는 빅데이터 AI 플랫폼을 구축하겠다는 계획

정부기관을 중심으로 예상보다 엄청난 변화가 생길 것으로 예상됨

자료가 너무 무궁무진하다 보니 앞으로 이 플랫폼을 어떻게 사용해야 결과를 잘 얻을지 고민이 될 듯

그래서 요즘 챗 GPT 활용방법(질문법)에 대한 강의나 책들도 나오는구나 이해하게 됨


image.png?type=w773 AI국회 제안요청서 일부


image.png?type=w773 AI국회 제안요청서 일부


image.png?type=w773 AI국회 제안요청서 일부




과업지시 내용 첫 번째 중 데이터 AI 전환이 눈에 띔

대부분의 공공기관들의 자료들은 그룹웨어를 통해 생산하지만 일반 상용 한글 SW를 동시에 사용함

그리고 과거부터 축적된 한글 파일(*.HWP)들을 마이그레이션 하겠다는 의미




데이터 유출 방지를 위해 온프레미스 방식으로 LLM 엔진을 구축함

image.png?type=w773




윗 분들 각종 행사 관련 축사 작성은 요즘 챗 GPT에 다 맡김

image.png?type=w773




한컴은 최근 AI 제품 두 가지를 밀고 있음

한컴 어시스턴트와 한컴 피디아임

한컴의 LLM 엔진은 LG의 오픈소스를 활용하며, 엑사원 3.5로 추정


한컴 어시스턴트는 기존 사용 중인 한컴오피스 패키지에 AI 기능을 추가해서 사용할 수 있음

온프레미스나 Saas에 추가 가능하며 한글 SW 외 MS 오피스에서도 애드업해서 사용할 수 있음

글로벌 확장성에 대한 부분도 생각할 수 있음

image.png?type=w773
image.png?type=w773




한컴디피아는 자연어로 검색을 하면 기관 내 데이터들을 학습하여 context에 맞는 답변을 하는 솔루션임

환각(할루시네이션)을 최소화하기 위해 RAG 기술을 도입함


RAG DB(Retrieval Augmentation Generation/검색증강생성) : 단순히 LLM의 출력을 최적화하여 응답을 생성하기 전에 외부의 학습 데이터 소스의 신뢰할 수 있는 지식 베이스를 참조하도록 하는 프로세스

= 내부 문서/데이터를 검색(Retrieval)해서, 이를 생성형 AI 모델에 함께 입력(Augmentation)하여 더 정확하고 실제 기반의 응답을 생성(Generation) 하는 기술

image.png?type=w773 출처 : 아마존




RAG 기술을 뒷받침하기 위해서는 한컴 데이터 로더가 필요함

한컴 데이터 로더는 HWP와 같은 한컴 데이터를 AI가 학습 가능한 확장자로 바꿔주는 파일 컨버터

묵은 한글 파일(*.HWP)들을 AI로 활용할 수 있게 해주는 기능

연식이 좀 된 공무원들이 관심을 보일 주요 기능 ㅎㅎ

image.png?type=w773




한컴은 공공기관을 대상으로 사업을 오랜 기간 추진하였고 시대의 변화에 맞는 생태계를 구축하는데 지속적으로 참여하기 위해 노력하고 있음

요약 : 온프레미스+ 오픈소스 + sLLM + 마이그레이션 + RAG




13.국내 ERP의 대명사 더존은 어떠할까?


더존비즈온 ERP 아마란스 10을 보면 한컴과 비슷한 구성임

API 브릿지 서버를 통해 AI API에 값을 주고받으며 RAG DB를 활용하여 결괏값을 최종 생성함

image.png?type=w773




외부망을 통하기 때문에 보안 우려가 있겠다고 생각했는데 더존비즈온 ONE AI PE라는 PRIVATE EDITION이 있음

여기도 LLM 엔진을 엑사원과 라마에서 가져와서 사용하여 데이터 보안에 대한 우려를 해소시킴

image.png?type=w773 출처 : 더존
image.png?type=w773 출처 : 더존
image.png?type=w773 출처 : 더존
image.png?type=w773 출처 : 더존


image.png?type=w773 다양한 한국어 오픈소스 모델




AI 모델별 벤치마크 평가를 확인할 수 있는 사이트가 많았음

한국어 LLM에 대한 평가가 궁금해서 가져왔는데 LG 엑사원이 높은 평가를 받고 있음

(아래 자료 출처를 잃어버림)

image.png?type=w773




14.결론


스터디를 하면서 생각보다 가까운 미래에 많은 변화를 목도할 가능성이 커졌다고 생각이 들었음

정부기관은 변화에 굉장히 보수적이지만, 모순적으로 굉장히 빠르게 적응하기도 하는 조직임

AI 솔루션 뿐만 아니라 온갖 정책들이 탑 다운 방식으로 의사결정이 내려오기 때문

중앙 부처에서 도입하면 모든 지자체는 따라서 사용할 수밖에 없는 구조임

이번 변화는 생각보다 빠를 수 밖에 없다고 생각됨


생성형 AI가 환각 현상이 있다고 하지만 RAG 같은 기술로 대응을 하고 있으며 최종 검증을 해야 하는 건 당연히 담당자의 몫임

보안의 영역이라는 문제점이 해소되고 나니 데이터의 재가공을 통한 활용 범위가 무궁무진하다는 점에 여러 기대감이 들었음

통계청의 챗봇을 통해 하나의 질문을 던졌는데 각 부처의 통계자료들/법령/정책들과 국회 도서관의 문헌들을 참고해서 답변을 받을 수도 있음

또한 많은 업무량을 쳐내고 계신 MZ 공무원들이 이번 변화의 주요한 수요처이기 때문에 불필요한 업무량은 크게 주는 대신 보다 심도 있는 업무를 맡게 되어 국가적인 서비스 수준이 개선될 수 있음



*사실과 다르거나 틀린 내용이 있을 수 있으므로 감안하여 참조 부탁드립니다.




keyword
작가의 이전글회사에 감정을 빼앗기지 마세요