brunch

You can make anything
by writing

C.S.Lewis

by JorbaChoi Jan 26. 2024

을의 Digital Finance 블로그(19)

금융기관의 AI 신기술 역량강화방안 

ABCDE 디지털 신기술 중 AI 신기술은 머신러닝, 딥러닝을 거쳐 발전하다,  ‘22년 하반기 ChatGPT가  대중화되면서  광범위하게 Gen AI (생성형 AI)를  활용하는 시대까지 빌전해왔다. 기술발전 사이클로 보면 GenAI는 ‘23년 Gartner가 발표한  Hype Cycle상에서 부풀려진 기대 수준의 최정점 (Peak of Inflated Expectations)에 위치해 있다.  분명히  과대 포장되어 있기도 하고, 기대 수준이 지나치게 높아져 있기도 하다.   아직 AI는 과거 데이터의 학습에만 의존하는 극단적인 경험론에 기반한 듯하고,  ChatGPT도 프롬프트 입력값에 맞는 확률론적으로 가장 그럴듯한 문장을 만들어 내는 작화에만 능한 듯하다.  순수하게 기술관점에서만 보면  예측과 분류, 통계기법 등 기술은 오랫동안 진화해 왔고,  AI는 단지 오래된 기술의 또 다른 표현일 뿐이라는 주장도 타당해 보인다.  


하지만 GenAI의 일반 사용자가 폭증하고 이에 대한 투자가 늘어가면서,  이에 상응하여 새로운 모델, 툴이 경쟁적으로 출시되고 있고  실제 적용 사례가 늘어나고 있다.  GenAI에 대한 논의도 이제는 탐색단계에서 파일롯, 실제 적용 단계로 급격히 이동하면서,  이제는 AI가 인간의 일을 빼앗아간다는 철학적인 논쟁을 넘어  실용적인  관점을 더 많이 고민할 시점이다.   


본 블로그는 상세한 AI기술을 논의하는 기술 블로그는 아니다.  하지만  어떻게 발전할지 예측하기 어려운 AI의 기회와 한계를 이해하기 위해,  간략하게라도 AI의 기술발전 흐름을 살펴보고자 한다. 

전통적인 AI/ML시대는 특정 비즈니스 영역에서 “예측”과 “분류”에 집중하여  개별 목적을 달성하는 AI시대였다고 하면 ,  새로운 AI시대는  대규모 데이터를 사전학습한 FM (Foundation Model)에 기반하여 여러 목적에 사용 가능한  GenAI 시대라고 할 수 있다.   전통적인  ML기술은  레이블링 된 데이터를 기반으로,  수치와 같은 간단한 입력을 간단한 출력과 매핑시키면서, 예측과 분류 등 패턴을 찾아내는 기술이라고 볼 수 있다.  데이터 레이블링, 데이터 준비, 모델 훈련을 위해 많은 인력과 비용을 필요로 하며,   특정한 하나의 타스크에 유용하다.  반면 DL(Deep Learning), 특히 GenAI 기술은 문서, 영상과 같은 레이블 되지 않은 데이터를 기반으로,  복잡한 입력을 복잡한 출력으로 매핑시키면서, 보다 발전된 방식으로 다양한 목적의 타스크를 수행할 수 있게 한다.  FM 중 하나인 LLM은 인터넷상의 수많은 데이터를 기반으로 미리 학습하여 수백억 개의 매개변수(Parameter)를 보유하고 있어, 다양한 영역에 쉽게 적용할 수 있고,  무엇보다 Prompt를 통해 자연어로 접근 가능하다.  


‘22년 하반기 출시된 ChatGPT는  초거대 언어모델 (Large Language Model)의 완성도를  분명히 높이는 기술적인 성과도 있었지만,  무엇보다 대화형 UI혁신을 통해 최단시간인 두 달 내  1억 명의 사용자를 돌파하면서 새로운 GenAI 시대를 여는 계기를 만들었다.  2000년대 인터넷 시대 , 2010년대 모바일 시대에 이은 새로운 UI 혁신이라고 불리기도 하는 이유이다. 


개발에 500억 이상을 투자하여  45조 개의 Token(단어)을 학습하고 1,750억 개의 Parameter (매개변수)를 가지고 있는 초거대 언어 모델(Large Language Model)을 기반으로 한 ChatGPT는 범용 AI에 대한 기대 수준을 높였다.  (LLM처럼 대규모 데이터로 사전학습된, Transformer라 불리는 신경망에 기반한 대형 모델을 FM(Foundation Model)이라고 함)  FM은 인간 뇌에 연결된 수십억 개의 뉴런에서 영감을 받은 확장된 인공신경망, 딥러닝에 기초하고 있다.  FM은 Text를 생성하고, 요약하고, 정보를 추출하고, Q&A, ChatBot 등 다양한 역할을 수행한다.  텍스트만이 아니라, 음성, 이미지, 영상, 프로그래밍 영역에 적용할 수  있다.  현실의 데이터 중  90% 이상을 차지하는 비정형 데이터, 즉 PDF, Video 등으로부터 학습하면서 소위 Multi Modal기능을 실현하고 있다.  나아가,  다양한 형태의 경량 오픈소스 모델인  sLLM 모델( small Large Language Model)도 출시되고 있고,   인터넷 연결 없이 스마트폰, 노트북 등 Device에 탑재하여 사용할 수 있는  On Device AI 모델도  출시되고 있다. 


Gartner에 따르면,  실제 데이터(Real Data)가 아닌 AI가 생성하는 합성 데이터(Synthetic Data)가 급격히 증가할 것으로 예상되고 있다.  ‘24년에는 Synthetic 데이터는 Real 데이터의 50% 정도의 볼륨까지 증가하고, ‘25년에는 마케팅 메시지 30%가 AI 가 작성하는 Synthetic 데이터가 되고,   ’ 26년에는 작성되는 Code의 50%가  AI가 작성할 것으로 예측되고 있기도 하다.  이러한 데이터 량의 증가는 다시 AI모델에 학습에 사용되어, AI의 발전속도를 가속화시킬 것이다.  


하지만  아직까지 범용 AI (AGI : Artificial General Intelligence) 수준은 그리 높지 않다고 본다.  ‘23년 12월 구글 딥마인드는 AGI(인공일반지능)를 크게 레벨 0부터 5까지 여섯 가지로 규정했다. 레벨 0은 AI 아님 ‘No AI’이고, 레벨 1은 숙련되지 않은 성인과 유사한 ‘Emerging’, 레벨 2는 숙련된 성인의 상위 50% 이상인 ‘Competent’, 레벨 3는 숙련된 성인의 상위 10%인  전문가 ‘Expert’, 레벨 4는 숙련된 성인의 1%인 거장 ‘Virtuoso’, 레벨 5는 숙련된 성인의 능력을 초월하는 ‘Superhuman’이라고 정의했다.  구글에 따르면  시장의 AGI는 아직 레벨 1이며, 일반 AGI에서는  레벨 2가 없다고 한다.   반면 한 영역에 특화된 특수 AI는 레벨 5도 존재한다.  아직까지는 정확도, 비용 등 여러 측면에서  특수 영역에 맞추어진 AI가 더 효과적이라고 보인다. 


본 블로그에서는 금융기관이 어떻게 AI 신기술을 활용하고 역량을 강화해야 하는지에 대해 고민해 보았다.  


첫째,  AI기술을 통해 비즈니스에 어떤 임팩트를 가져올 수 있을지 깊이 고민하고,  실질적인 가치를 제공하는 적용사례를 확장해 가야 한다.  금융기관은 AI 신기술을 활용하여,   새로운 고객경험을 만들거나, 비즈니스 프로세스 개선하거나, 생산성을  향상시키는 변화를 만들어 낼 수 있는 많은 기회가 있다.    


새로운 고객경험을 만들어 내는 데는,  고객 상담을 넘어,  초개인화 마케팅까지 광범위하게 활용될 수 있다. 고객 Targeting과 상품 추천 알고리즘 등 디지털 마케팅은 AI를 통해 지속적으로 고도화할 수  있다.   챗봇상담, 음성상담을 포함하여 컨택센터에는 AI를 통해 실질적으로 새로운 고객경험을 만들어 낼 수 있는 기회들이 많다.   도입단계에 따라서는 챗봇상담, Virtual 상담을 전방위적으로 확대하는 것보다,  우선 축적된 음성 상담 데이터를 Text로 변환하여,  Text Analytic을 적용하면서 QC 업무를 강화하는 과제가 ROI가 높다. 해피콜 또는 완전판매 모니터링도 Virtual assistant가 담당할 수 있다.  AI를 통해 고객민원도 조기에 감지하고, 상담원 Skill을 개선하는 효과를 거둘 수 있다


비즈니스 프로세스 개선 기회를 전사적으로 탐색해야 한다.   여신, 수신, 외국환 비즈니스 프로세스에서 자동심사, 사기검출, 핵심예금 잔액/평잔 예측 등 과제를 탐색하여 우선순위를 정해야 한다. Task 수준의 자동화를 넘어,  워크플로우 자동화로 확대하고, 인간이 Virtual Assistant와 협업하는 단계로 가고 있는 추세에 맞추어,  비즈니스 프로세스를 개선할 기회가 많다.   


생산성 향상을 위해 모든 직무에서 기회를 찾아봐야 한다.  회의록 작성과 요약과 같은 기본적인 업무를 포함하여  본부 직원의 생산성 향상,  영업점 직원의 고객응대 생산성 향상  등 많은 기회들이 존재한다.  프로그래머들도 AI 도움을 받아,  코드를 추천받고,  테스트를 자동화하고, 관련 문서를 자동작성 등을 통해  전체적으로 생산성을 향상시킬 수 있다.  또한  직원들이 개인적으로 생산성을 높일 수 있도록  ChatGPT 등 GenAI를 활용할 수 사용할 수 있는 환경(예 MS O365환경)을 제공해 줄 수 있다.   보안을 포함한 리스크를 관리하기 위한 가이드와 함께,  안전한 사용 환경을 구축하기 위한  고민들도 필요해 보인다.  


무엇보다 비즈니스 문제가 무엇인지 잘 이해하고 정의하는 것이 우선이다.  AI/ML에 대한 이해가 낮고 추진력을 얻기 힘들었던  초기에는,  추진동력을 얻기 위해  각 비즈니스에 포함되어 있는 Intelligent 한 기능들을 모두 AI로 포장하고 과제수를 부풀리기도 했었다.  AI에 대한 성숙도가 어느 정도 갖추어진 조직이라면,  기술적인 실험보다는 비즈니스 임팩트가 큰 적용사례에 집중하는 것이 바람직하다.  일반적인 영역보다 특정 영역에 집중하여,  MVP(Minimum Viable Product)를 만드는 혁신과제를 추진하는 것이 중요하다.  


특정 과제에 효과적인 전통적인 ML/ AI 과제와  달리,  새로운 기술인 GenAI과제에 대해서는,  도입타당성 검토 단계를 지나  적용사례를 찾고  빠르게 실험하고 학습해 나가는 방식이 이야기되고 있다.  금융기관은 이미 마케팅, 리스크 관리, 컴플라이언스 각 영역에 설루션 형태이든 In-house 개발 형태이든 이미 전통적인 AI/ML모델을 포함하고 있다.  GenAI시대가 도래했다고 해서, 새로운 애플리케이션이나 워크 플로우를 만드는 것보다, 기본의 워크 프로세스 안에서 최소한의 변경으로 최대한의 효과를 갖도록 디자인하는 것이 바람직하다. 

 

그리고 혹시 전통적인 방식을 풀 수 있는 문제를 어렵게 AI를 통해 풀려고 하는 건 아닌지 자문해 봐야 한다.  예를 들면 금융기관 내에는 축적된 과거 거래와 Q&A에 기반하여,  일반적인 룰 기반으로 이미 구축되어 운영되는 정형화된 Chatbot영역이 있다.  이런 영역에  

굳이 새롭게 GenAI를 이용하려고 하면  훨씬 더 많은 시간과 노력이 소요된다.  프롬프트 입력 제한(4K)도 있어 충분한 맥락을 제공할 수 없기도 하고,  토큰(단어) 당 과금되는 GenAI 속성상 더 많은 비용을 초래하기도 하며,  Prompt Engineering에 훨씬 더 많은 시간과 노력이 소요되기도 한다.  


둘째,   AI는 모델이 가장 중요하지만, 결국 금융기관 자체의 고유한 데이터로 차별화해야 한다.   전통적인 AI/ML 모델은 이미 외부에서 구입한 설루션 형태 또는 In-house 형태로 구축되어 기존 비즈니스 프로세스에 포함되어 있다. 반면 대규모 FM 모델에 대해서는 먼저 자체모델을 구축할 것인가 또는 외부모델을 활용할 것인가에 대해 결정해야 한다. 


데이터와 인력이 충분한 경우, 자체적인 모델을 개발하는 것도 방법이겠지만,   사전학습에만 몇백억이 소요되는 FM이  이미 상용화되어 있어  자체적으로 구축하는 것은 의미가 적다. 게다가 빠르게 발전하는 AI세계에서,  지속적으로 업그레이드되는 외부 모델을 활용하는 장점이 많다. 외부 모델의 선택하는 경우에도, FM, LLM은 Open-Source와 Closed-Source 모델이 존재한다. 또한  성능, 비용, 서비스 호환성, 언어등 다양한 기준에서 비교분석이 필요하다.  ChatGPT 같은 Closed-Source 모델의 경우  토큰 기반으로 과금되는 LLM사용료에 대한 고려가  필요하다. 


전체적으로 사전학습에  천문학적인 자원과 노력이 소요되는  LLM, FM 모델은 자체 구축하는 방식 보다,  오픈소스를 포함한 외부 모델을 활용하는 것이 현실적이다.  이 경우에도 커스터마이징 노력이 많이 드는 범용 모델보다는,  특정 영역에 특화된 경량화된 sLLM 모델이 정확성, 비용 측면에서 유리할 수 있다.    


핵심은 금융기관이 보유한 고품질 자체 데이터로  차별화하는 것에 있다.   현대의 모든 비즈니스는 데이터 비즈니스라고 볼 수 있고,  특히 데이터 Quality가 중요하다.  금융기관이  고품질의 내부  데이터를 이용하여 GenAI 모델을 최적화하는 데는 크게 지속적으로 추가학습(지속적인 Pre-training)을 시키거나,  미세 조정(Fine-tuning) 하거나,  확장된 프롬프트 방식인 RAG (Retrieval Augmented Generation) 방안이 있다. 비용효율성  측면에서  지속적인 Pretraining 보다는  Fine Tuning이, Fine Tuning 보다는  RAG (Retrieval Augmented Generation) 방안이 추천된다.   


이하에 금융기관이 보유한 데이터를 이용하여,  외부 FM 모델을 최적화할 수 있는  대표적인 세 가지 방안을 간략히 살펴본다.   

지속적인 Pre-training 방법은 Labeling 되지 않은 자체 데이터를 활용하여 모델을 학습시키며,  추가로 일반적이거나 특별한 지식을 반영한다.  지속적인 사전학습을 위한 GPU, TPU 등 컴퓨팅 파워와  함께 모델을 핸들링하고 개선할 수 있는 인력이 필요하다. 학습 데이터 볼륨에 따라 많은 투자가 필요한 대신,  새로운 FM에 기반한 차별화된 경쟁력을 보유할 수 있다.     

 Fine Tuning은  우리가 기본지식을 습득한 후 특수분야의 지식을 습득하는 것과 같다. 적은 양의  Labled 데이터 사례를 활용하여 모델을 변경시키거나,  특정 Task 수행을  위해  특정한 지식을 반영하거나 또는 고객응대를 위해 답변의 톤과 스타일을 조정할 수도 있다.  학습 데이터 볼륨이 크지 않으므로, 약간 변경된 FM을 보유할 수 있으며 지속적인 Pre Training 방식 대비  필요한 투자는 상대적으로 적다.    

 Prompt를 확장시키는 방법으로 가장 비용효율적인 RAG (Retrieval Augmented Generation) 기법이 급속하게 확산되고 있다.  모델의 변화 없이, 답변 생성 시  적합한 특별한 지식만 반영하게 할 수 있는 기법이다. 모델에 변경을 가하지는 않지만 Prompt Engineering (원하는 결과에 가깝도록 입력 값을 가다듬는 과정)이란 용어가 나온 거처럼,  Prompt를 잘 작성하는 것은 GenAI를 효과적으로 활용하는 방법이다.   Prompt는 통상 입력값이 제한이 되어 있는데 (ChatGPT의 경우 4K),  금융기관 내 보유하고 있는 고유한 PDF 등 문서를 Vector Embedding*하여,  쉽게 탐색할 수 있게 하는  확장된 프롬프트(Augmented  Prompt) 방식이다. ( * Vector Embedding : 비정형 데이터인 사람이 쓰는 자연어를 기계가 이해할 수 있는 실질적인 숫자의 나열인 벡터로 바꾸는 과정)   


셋째,  AI의 핵심은 모델과 데이터이지만,  특정 기술이나 플랫폼에 종속되지 않는 지속적인 유연하고 확장성 있는 AI아키텍처를 준비하는 것이 중요하다.  전통적인 AI/ML시대에도 모델을 지속적으로 학습시켜야 하기 때문에,  관련 데이터를 수집하고 학습시키고, 적용시키는 오퍼레이션을 자동화하는 주제, AIOps, MLOps 가 중요했다.  GenAI시대에 접어들면서  모델, 툴, 프레임워크가 다양화되면서 전체적인 AI 아키텍처의 중요성이 더 커질 것으로 예상된다.  초기에는 외부 SI사업자를 통해  새로  구축하거나, 또는 자체 보유한 AI아키텍처를 업그레이드하는 방안도 있다.  그러나 많은 변경과 개선이 예상되는 AI아키텍처의 핵심적인 부분은 자체적으로 개선해 갈 수 있는 역량이 중요하다.   


AI 아키텍처는 크게  인프라 영역/ Tool과 Framework 영역 / 애플리케이션 영역의  세 가지 영역으로 나누어 볼 수 있다.  시장의 경쟁력 있는  AI모델로 쉽게 변경할 수 있고,  지속적인 학습과 Training이 가능한 구조, 즉  특정기술이나 플랫폼에 락인되지 않는 Plug-in Plug Out 할 수 있는 확장성 있는 아키텍처를 지향해야 한다.  예를 들면 경쟁모델 대비 얼마나 높은 정확도를 가지고 있는지와 같은 기술의 확장성을 판단해서,  신속하게 모델을 변경할 수 있어야 한다. 


인프라는  강력한 컴퓨팅 리소스, 데이터 스토리지, 머신러닝 도구를 활용할 수 있는 클라우드 사용이 전제된다.  특히  엄청난 양의 데이터와 이를 학습할 강력한 하드웨어인 GPU, TPU**가 필수적이다.  벡터 행렬 연산을 고성능 병렬 프로그램으로 수행하고, 이를 가속화하기 위한 AI Chip은 지속적으로 발전할 것으로 예상된다.  ( ** 수십억 개의 매개변수를 병렬로 처리할 수 있는 “가속기”칩을 가지고 있는  GPU, TPU로 구성된 대규모 클러스터가 필요하며,  GPU/TPU는 고가여서 클라우드에서 수행하게 됨)


Tools & Framework 영역에서는 FM 모델을 저장하고 애플리케이션에 배포하기 특화된  AIOps, MLOps 도구 및 기술을 제공한다. 여기에 추가 훈련 데이터를 통합하고 애플리케이션이 모델과 상호작용하도록 API를 구축하는 기능을 포함한다. 텐서플로우, 파이토치, 케라스 등 프레임워크는 모델 구축 및 학습을 위한 생산성을 높여 주며,   벡터 행렬에 수치화하여 저장하고 신속히 검색하고 계산하게 해주는 벡터 DB 등이 발전하고 있다.  이와 관련하여 MS, 구글, AWS 등  툴과 프레임워크를 제공하는 클라우드 업체의 발전 속도가 눈부시다. 


Application에서는 기존의 Application에 AI를 Embed 하는 것과  새로운 GenAI 애플리케이션을 만드는 것을 고민해야 한다.  금융기관들은 기존의 애플리케이션을 통해 AI 기능을 Embedd 하는 것을 먼저 고려해야 한다  


넷째,  AI 조직과 인적역량 확보에 대한 고민이다.   부족한 AI 전문인력을 고려할 때,  AI competency 센터가 현실적인 방안인데, 이경우 AI센터는 조연 역할을 해야 한다.  전반적인 AI Literacy를 높이고 현업이 AI과제를 주도하게 해야 지속적인 결과를 만들어 낼 수 있다. 


현실에서 AI과제를 수행하는 데 대부분의 일은 모델보다는 통합과 연계 같은 System Integration 타스크가 대부분이다.  AI 모든 단계를 수행하는 Superman은 없다.  핵심적인 모델링을 하는  Data Scientist는  기획자나 단순 개발자가 아니라 특정한 과제에 대해서  알고리즘과 Parameter를 최적화할 수 있는 사람이다.  핵심적인 모델 관련 AI인력을 확충해야겠지만,  기존 인력을  Re-skill, Up-skill 시켜 전체적인 AI 역량을 강화해야 한다.  GenAI 시대에는 모든 직원이  CDS(Citizen Data Scientist) 역할을 수행했던 것처럼  최상의 응답을 얻기 위해  Prompt Engineering을 어느 정도 할 수 있어야 한다.  개발자 수준에서는  Vector DB에 기업의 고유정보를 추가하여 검색을 최적화할 수 있는  새로운 RAG 기술을 다룰 수 있어야 하며,  데이터 사이언티스트는 모델을 Fine Tuning 할 수 있어야 할 것이다.  하지만 AI는 교육만으로 양성되기 어렵다. 현장에 실제 적용하는 프로젝트를 통해 양성할 수 있도록 의미 있는 AI과제를 발굴 추진해야 한다. 


새로운 AI기술에 대해서는 외부에 역량 있는 파트너들과  함께 해야 한다.  빅테크뿐만 아니라 스타트업과의 협업도 고려해야 한다.  통상 스타트업은 기술력은 있지만  데이터와 자본이 부족한 경우가 많다.  공동으로 프로젝트를 진행하여 모델에 대해 공동소유 후 일정기간 배타적 사용하는 방식도 고려할 수 있고,  나아가  피를 섞는 즉 지분투자를 하는 Strategic Investment를 검토할 수 있다.  


다섯째,  Responsible AI에 대한 포괄적인 접근과 거버넌스가 필요하며, 실제로 이를  워크플로우 내에 적용하고 개선해 나가야 한다.  금융기관은 AI모델이 설명가능하고 윤리적이고 투명한지  확인할 책임이 있으며, AI모델개발 및 적용의  전 라이프 사이클에 걸쳐 거버넌스를 갖출 필요가 있다.   AI가 완벽하지 않을 수 있지만,  금융기관은 신뢰가 우선이다. Data Security 만이 아니라  투명하고, 공정하고 윤리적인 AI를 지향해 가야 한다.  


설명가능한 AI (Explainable AI), 즉 AI의 불완전함을 인식하고 설명력을 높이도록 지속적으로 노력해야 한다.  AI는 과거 데이터 기준으로 극단적인 경험론,  통계적 결과치에 불과할 수 있으나 대량의 데이터와 모델의 복잡성으로,  모델을 개발한 연구원조차 결과물이 어떻게 나오는지  완전히 이해하지 못하는 경우가 많다. 실제로  자산운용을 AI 포트폴리오에 맡겼더니 성과는 좋은 데  설명할 수 없는 경우가 많았다.  하지만 설명력을 높이는 준비를 계속해야 한다.


윤리적인 AI,  즉 편향성을 줄이고 공정성을 높이는 노력을 진행해야 한다.  현실세계를 언어로 표현하고 기록한  데이터는 이미 그 자체로 왜곡되어 있다.  인간의 편견보다 무서운 것은, AI가 만들어내는 편향성은 고착화되고 다시 데이터로 쌓이면서 재생산될 수 있는 위험에 있다.  (ChatGPT를 사용하는 우리는 다시 ChatGPT 학습시켜주고 있는 셈이다.)   예를 들어 여신의 가산 금리 결정에 영향을 주는 Credit Scoring에 적용하는 AI는 불평등을 심화시킬 수 있다.  과거 인사 데이터에 기반한 AI 인사 채용 정책은  공정성, 다양성, 포용성 관점에서 더 불평등을 고착화시킬 수 있다.  데이터 모델러, 기획자에게 금융 AI 윤리헌장을 사인하게 하기도 했지만,  단순 홍보정책에 그쳐서는 안 된다.  


기획단계부터 차별을 유발할 수 있는지,  데이터가 편향되게 수집되지는 않는지  방지해야 한다. 차별을 유발하는 변수를 보호변수(Protected Attribute)로 설정하고 원천적으로 학습에 사용하지 않더라도,  이미 다른 데이터를 통해 추론될 수 있기 때문에  결과적으로 영향을 미치기도 한다.   이러한 간접적인 차별까지 고려하여 공정성을 확보하기 위해서는 결과를 직접 통제할 수 있어야 한다.   MS, Google, IBM 등은 사전점검할 수 있는 공정성 지표와 진단도구를 개발하여 오픈소스로 공개하고 있다.   


리스크를 관리하는 투명한 거버넌스,  즉  AI 프로세스 전 과정에 걸쳐 위험을 점검하고 모니터링하는 체제를 갖추어야 한다.  AI  기획/설계/운영을 포함하는 End to End로 잠재적 위험을 지속적으로 모니터링하고,   모델의 정확도와 신뢰성, 보안, 비용, 규제와 같은 리스크 관리 기능을 고려해야 한다.   실제로 AI시대에는 비즈니스 애플리케이션 내에 AI가 부정확한 콘텐츠(환각현상),  저작권 문제 등을 확인할 수 있는 전문가가 워크플로우 내에 포함되어, 새롭게  관련 직무를 수행해야 한다.   


세일스포스는 민감한 데이터가 실제 모델에 학습되거나, 기업외부에 유출되지 않는다는 점을 강조하면서 그 메커니즘을 상세하게 설명하고 있다.  금융기관도  AI 관련 시스템과 프로세스에,  각종 리스크를 관리하는 투명한 거버넌스가 잘 작동하고 있는지 규제기관으로부터 요구받을 것이다.   앞으로는 규제기관으로부터의 요구사항을 수동적으로 증명하는 것을 넘어서,  적극적으로 홍보하고 설명할 수 있어야 하는 시대로 변화될 것으로 예상된다.   


주요 참고자료   

Mckinsey : https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/  

Gartner : https://www.gartner.com/en/insights/

삼성 SDS : https://www.samsungsds.com/kr/insights/

 LG CNS : https://www.lgcns.com/blog/cns-tech/ai-data/ 

조대협의 Blog : https://bcho.tistory.com/  

AWS re:invent 2023

디지털 초격차 코드나인, 이상호


작가의 이전글 을의 Digital Finance 블로그(18)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari