brunch

You can make anything
by writing

C.S.Lewis

FDS, 토스를 주목하라

기술스크랩

이상 금융 거래 탐지 시스템(Fraud Detection System, FDS)


개요 

    이상 금융 거래 탐지 시스템(Fraud Detection System, FDS)은 전자 금융 거래 시에 결제자의 다양한 정보를 수집해 패턴을 만든 후, 정상적인 패턴과 다른 패턴을 보이는 이상 결제를 잡아내고 결제 경로를 차단하는 금융 거래 보안 방식이다. 최근에는 고객들의 거래 데이터들과 머신러닝 기법을 통해서 더욱 효과적으로 이상 금융 거래를 탐지하는 방식을 많은 금융 회사, 핀테크 기업들이 사용하고 있다.


예를 들어 A 지역에서 오후 1시에 결제가 되었다고 했을 때, 30분 뒤 A 지역의 다른 어떤 지역이나 A지역 근교에서 결제가 일어난다면 정상적인 결제로 볼 수 있을 것이다. 그러나, 30분 뒤 A 지역이 아닌 다른 지역이나 외국에서 결제가 발생한다면, 이는 비정상적인 결제로 의심할 가능성이 있다. 이런 경우에 금융 기업에서는 자체적으로 거래를 중단시키고, 피해를 본 금융 제품 소유자에게 이상 거래가 있다고 보고하는 것이 FDS의 예이다.

    

사실 FDS는 양날의 검이다. 송금과 결제 과정에서 FDS가 사기를 판단하는 기준을 너무 엄격하게 적용하면 사이렌을 띄우는 사례가 줄어서 사기 거래를 막고 사용자를 보호하는 효과가 유명무실해진다. 반면 너무 느슨하면 사기 거래가 아닌데도 사기 거래라고 빈번하게 경고를 띄워 사용자 경험을 해친다. 더는 '긴급하게 느껴지지 않는' 긴급재난문자처럼 사이렌이 울려도 무덤덤해진다. 따라서 사용자 보호와 편리함 사이에서 절묘한 접점을 찾아야 한다.


이러한 이상 금융 거래 탐지 시스템의 방법들은 회사마다 다양한 금융사기에 사례에 대한 전반적인 노하우와 경험, 데이터를 녹여서 시스템을 구축한 것이기 때문에 대부분의 기업에서 기밀사항으로 취급하여 공개하지 않고 있다. 하지만 FDS를 주기적으로 고도화하고 있으며, 사용자들에게 안전한 거래를 제공하기 위해서 지속적으로 노력하고 있다.


FDS

     FDS는 크게 정보수집, 이상거래 분석, 대응으로 구성된다. 로그 수집 시스템은 실시간 거래정보를 수집하고 대용량 데이터를 정제하여 이상거래 분석 시스템에 전달한다. 이상거래 분석 시스템은 로그 수집에서 전달받은 데이터와 고객정보, 외부정보를 종합적으로 판단하여 거래이상여부를 판단한다. 대응시스템은 이상거래 분석 시스템이 이상거래라고 판단한 거래에 대해 유형별 대응 시나리오에 따라 사용자 접속차단, 담당자에게 확인 알람 등의 자동화된 시스템 조치를 수행한다. 인공지능 탐지 모델은 새로이 발견된 거래패턴에 대한 내용을 학습하여 성능을 개선하여 이상거래 분석 시스템에 수시로 반영시킨다.

대표적으로 FDS의 기술적 분석 방법은 크게 오용탐지(Misuse) 기법과 이상탐지(Anomaly Detection) 기법 두 가지로 구분된다.

  

오용탐지 기법은 기존 이상거래 또는 사기거래에서 나타나는 주요 특징들을 조건화, 규칙화(Rule) 하여 새로이 발생하는 금융거래에 다중 조건(Multi Rule-Based)을 적용하여 필터링하는 방식으로 이상거래 여부를 식별하는 것으로 이해할 수 있다. 이 방식은 빠르고 단순한 구조지만, 새로운 패턴에 대응이 어렵다는 단점이 있다.

  

이상탐지 기법은 데이터베이스에 저장된 고객 기본 정보, 거래 정보 등의 속성(Attribute) 정보를 바탕으로 모델링하여 특이점을 탐지하는 것으로 이해할 수 있다. 이 방식은 복잡한 구조의 데이터를 종합적으로 판단하는 것으로, 발견하기 어려운 이상거래 및 사기거래를 찾아내지만, 실시간으로 처리하기에는 고성능 시스템이 요구된다는 단점이 있다.

  

인공지능 기술 기반의 FDS는 인공지능 모델에 금융거래 '전체' 데이터를 주고 이 중에 사기거래가 어떤 것인지 알려주면, 인공지능이 사람이 파악하지 못한 사기 거래 패턴까지 종합적으로 파악하여 새로운 금융거래가 사기패턴과 얼마나 유사한지를 따져 사기거래를 식별한다. FDS를 위한 인공지능 모델은 대체로 목적변수 Y의 값(Label)이 명확히 기재된 구조화된 데이터(Structured Data)를 학습하는 지도학습(Supervised Learning) 모델 중 이진 분류 예측 모델(Binary Classification Prediction Model)로 분류된다. 이진 분류 예측 모델이란 ‘사기자 맞음’ 또는 ‘사기자 아님’과 같이 예측해야 할 목적변수 값이 두 가지임을 의미한다. 

  

이진 분류 예측 모델의 기본 원리는 로지스틱 회귀(Logistic Regression)로 이해할 수 있다. 로지스틱 회귀는 수치형 데이터 예측 모델인 선형 회귀(Linear Regression) 모델의 결괏값에 시그모이드 (Sigmoid) 활성함수를 첨가하여 범주형 변수를 예측하는 모델이다. 시그모이드 활성함수란 음의 무한대부터 양의 무한대까지의 실수를 0부터 1 사이의 숫자로 변환시켜 주는 함수다. FDS에서는 0을 비사기자, 1을 사기자로 치환하여 데이터를 학습시킬 수 있다.

  

로지스틱 회귀 외에 사용가능한 지도학습 방법으로 의사결정 나무 기반 모델이 종종 활용되는데 일반적으로 널리 사용되는 것은 RandomForest, GBM 등이 있다. 지도학습 방식 외에도, GAN, KNN 등 비지도 학습 모델을 적용하여 미리 학습되지 않은 패턴에 대해서도 어느 정도 정확도를 갖는 학습모델을 설계할 수도 있다.



활용 사례


    위에서도 언급했듯이, FDS 기술은 회사마다 노하우와 경험, 데이터를 바탕으로 시스템을 구축한 것이라 기밀사항으로 취급하여 공개하지 않고 있다. 하지만 이례적으로, 토스는 FDS 관련 수치를 공개했다. 토스의 발표에 따르면 2022년 한 해, 토스의 자체적인 FDS를 이용해 약 31만 건의 사기 거래를 막았다고 한다. 시간으로 환산하면, 2분에 1번 꼴로 이상 거래를 탐지하여 사기 거래를 차단하고 있다는 것이다. 그렇다면 다른 금융사는 어떨까?


2021년 KB국민은행이 FDS 기술을 자체 개발했다는 보도에 따르면, 적발한 사기 거래가 하루 평균 3~4건이다. 1년에 1,500건도 되지 않는 수치이다. 또한 2018년 금융감독원이 은행과 증권사의 FDS를 분석한 자료를 살펴보면, 2017년 한 해 동안 20개 은행 전체에서 이상 거래 사고를 예방한 것은 3,588건이다. 1개 은행 기준 약 180건에 불과한 수치이다. 이는 모두 토스의 한 해 동안의 사기 거래 차단 수치인 31만 건과는 비교가 되지 않는다.


토스 FDS가 사용하는 머신러닝 모델은 지도학습(Supervised Learning) 방식만 사용한다. 즉, 다양한 부정 거래 데이터를 미리 알려주고 학습한 부정 거래와 비슷한 것이 있는지 찾는다. 머신러닝 모델은 토스에서 이뤄지는 모든 송금에 대해 실시간으로 추론해 부정 거래 점수를 계산한 후 사이렌을 울린다. 

토스 FDS는 위와 같은 다양한 데이터를 활용해 사기 거래를 판단한다.


또한 FDS의 효용을 결정하는 두 번째 요소는 속도이다. 머신러닝과 자체 룰, 외부 사기 거래 데이터를 모두 빠른 시간에 대조해 사기 거래 여부를 판단해야 한다. 토스는 API를 이용해 경찰청 자료와 더치트 정보에 대해 사기 신고 여부만 조회하는 방식으로 빠르게 처리한다. 이처럼 API를 활용하는 방식은 FDS뿐만 아니라 토스 앱의 전반적인 속도를 높인 핵심 요소다. 초창기 토스 앱은 사용자가 앱을 열자마자 모든 서비스의 최신 정보를 업데이트했다. 하지만 이제는 자동으로 실행되는 API를 최소화하고 송금, 결제, 증권 등 사용자의 의도가 파악되는 순간 필요한 API가 정보를 가져온다.


또한 토스는 속도 향상을 위해 필요한 컴퓨팅 파워 인프라를 구축하기 위해서 서초와 평촌으로 데이터센터를 이중화해 운영하고 있다. 보통 데이터센터를 이중화하면 한 곳은 액티브(활성화) 상태, 다른 한 곳은 스탠바이(대기) 상태로 둔다. 주센터에 장애가 발생하면 다른 한 곳으로 재해복구가 이뤄지는 식이다. 하지만 토스는 2곳 모두를 액티브-액티브 상태로 운영한다. 필요에 따라 사용자 트래픽을 50대 50, 70대 30 등으로 조절한다. 대규모 증설이나 장애 상황에서도 중단 없이 사용자가 서비스를 이용할 수 있는 이유다.



기술과 사례에 대한 인사이트


  토스의 사례에서 주목할만한 점은 단연 다른 금융사에 비해 비교할 수 없는 사기 탐지 사례 건 수이다. 2017년 한 해 20개의 금융사 전체에서 이상 거래를 탐지해서 예방한 사기 건수가 약 3,600건, 2021년 KB국민은행이 1년 동안 탐지한 사기 거래가 1,500건인 것에 비해, 토스가 작년 한 해 이상 사기 거래로 탐지한 건 수는 약 31만 건이다.


시간이 지날수록 점점 고도화되는 금융 사기 범죄에 대응하기 위하여, FDS 기술의 고도화 역시 같이 나아가야 할 것이다. 특히 토스가 개발한 FDS는 지도학습만을 사용하는 방식인데, 지도학습은 기존에 확인된 데이터로만 학습을 진행하기 때문에 이전에 발생한 적이 없는 부정 거래 패턴을 찾아내는 것에는 취약할 수도 있다고 생각한다. 따라서 이러한 취약점을 보완하기 위해 비지도학습이나 딥러닝 기법을 함께 사용하는 앙상블(Ensemble) 기법을 활용하여 FDS 시스템을 한 단계 더 고도화시키는 방법도 고려해 볼 수 있을 것이다.


금융 거래 시장은 높은 신뢰를 기반으로 거래가 이루어지는 시장이다. 따라서 사용자가 불안감 없이 금융 서비스를 이용할 수 있는 환경을 조성하기 위해 FDS 시스템의 발전은 앞으로도 불가피할 것으로 보인다.



함께 생각해 볼 만한 논점


Q1. FDS      기술은 양날의 검이라고 위에서 소개했듯이, 사기 거래 판단 기준을 너무 엄격하게 적용하면, 경고를 띄우는 사례가 줄어서 사기 거래를 막고 사용자를      보호하는 효과가 유명무실해진다. 반면 너무 느슨하면 사기 거래가 아닌데도 사기 거래라고 빈번하게 경고를 띄워 사용자 경험을 해친다. 이러한      Trade-Off 관계에서, 과연 사용자들의 입장에서 어떠한 상황이 더 나을까?



Reference

https://www.2e.co.kr/news/articleView.html?idxno=301050

https://bitnine.tistory.com/397

https://www.itworld.co.kr/topnews/282031

https://blog.naver.com/hst0131/223045972646

https://blog.toss.im/article/toss-fds-team


작성자: ITS 23기 정지훈 


작가의 이전글 초거대 인공지능 모델이 해줄 수 있는 것
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari