brunch

You can make anything
by writing

C.S.Lewis

by Ryan Choi Jan 21. 2024

신용평가모형의 미래 ① : 새로운 데이터의 활용

금융거래 데이터 vs. 대안 데이터

신용평가를 위해 활용되는 데이터


앞서 두 차례 설명드린 대로, 신용평가를 위해 그동안 활용되어 온 데이터는 주로 해당 차주의 금융거래와 관련된 것들이 대부분입니다.

'차주'는 돈을 이미 빌렸거나, 빌리려고 하는 주체(개인 또는 기업)를 의미


개인의 경우에는 채무상환 이력, 대출의 규모나 형태, 신용거래 기간 등이 신용평가에 주로 활용되어 왔으며, 기업의 경우에는 평가대상 기업의 금융거래 이력뿐만 아니라, 재무제표를 기초로 한 재무정보와 그 기업의 상태를 수치로 확인할 수 있는 각종 비재무정보 등이 활용되어 왔습니다.


하지만 금융거래 경험이 없거나 있다 하더라도 평가에 활용할 수 있을 정도의 이력이 충분치 않은 경우 또는 신뢰하기 어려운 데이터를 가지고 있는 경우에는 신용평가를 하고 싶어도 하지 못하는 상황이 발생하게 됩니다. 그리고 그러한 경우에는 대출 승인이 되지 않거나 한도, 금리 측면의 불이익을 받을 수 있습니다.


그 이유는 대부분의 금융회사에서 금융거래 데이터를 기반으로 신용평가모형을 구축하여 운영하고 있기 때문에, 데이터가 충분히 수집되어 있지 않거나 데이터의 신뢰성이 낮은 경우 해당 차주의 신용도를 정확하게 판단할 수 없고, 모형의 결괏값을 기반으로 여신 의사결정을 내리는 것이 힘들어지기 때문입니다.


그래 이러한 문제를 해결하기 위해, 금융거래 데이터를 대신하여 개인이나 기업의 신용을 확인하기 위한 대안 데이터(alternative data)의 활용 시도가 활발히 진행되어 왔습니다. 


또한 데이터 누락이나 부족에 따른 문제 외에도 금융거래 데이터에 대안 데이터를 추가로 활용하게 되면 기존 모형의 성능 향상 효과도 있어 대안 데이터를 발굴하고 활용하려는 시도는 더욱 증가하는 추세입니다.



대안 데이터의 종류와 형태


대안 데이터는 차주의 유형에 따라 다르게 활용됩니다. 먼저 국내외 문헌과 비즈니스 사례들을 통해 확인한, 개인 신용평가를 위해 활용되는 대안 데이터에는 다음과 같은 것들이 있습니다. 


요금 납부정보 : 전화 요금이나 전기, 가스, 수도 등 유틸리티 이용에 따른 요금 납부정보를 평가에 활용, 특히 정기적인 요금 지불 여부는 개인의 신용도를 측정하는 중요한 지표

전화 이용정보 : 휴대전화 가입 정보, 통화 상세기록 정보, 소액결제 정보 등을 분석하여 평가에 활용

온라인 활동 이력 : 개인이 온라인상에서 활동을 하면서 남기는 다양한 기록들을 'Digital Footprint'라고 부르며, 전자상거래 이용 이력(결제금액, 이용시간대, 소비패턴, 단골 비율 등), 소셜 미디어 활동, 이메일 이용 패턴 등이 해당

심리테스트 결과 : 심리테스트로 확인한 개인의 성격 특성이 재무적 활동과 관련이 있다는 연구결과를 근거로 성실성, 지속성 등을 확인할 수 있는 성격 특성을 대안 데이터로 활용


이 외에도 위에서 소개한 2~3가지의 대안 데이터를 함께 묶어 활용하거나 신용 위험 수준이 유사한 사람들이 같은 장소에 있는 경우가 많다는 연구결과를 근거로 위치 정보를 신용평가에 활용하기도 합니다.


한편, 기업 신용평가를 위해 활용되는 대안 데이터에는 다음과 같은 것들이 있습니다. 


금융시장 정보 : 주가, 거래량, 시가총액, 종합주가지수, 변동성 지수 등

거시경제 지표 : GDP 추이, 산업생산지수, 생산능력지수, 설비가동률, 기업경기실사지수, 금리, 환율 등

전문가 판단 정보 : 해당 산업이나 기업에 대한 전문성과 인사이트를 보유한 전문가의 주관적인 판단에 의한 기업의 위험도를 계량화하여 활용(경영위험, 영업위험, 산업위험 등)

기업 평판정보 : 뉴스나 소셜 미디어에서 언급되는 기업에 대한 키워드들을 데이터 마이닝하여 기업 평판을 수치화하고 이를 기업 신용평가에 활용


금융거래 데이터를 이용하기 위해서는 데이터의 수집과 관리를 위해 상당한 비용과 시간이 필요하고, 이를 위한 체계적인 프로세스와 금융 인프라 기관이 구비되어야 합니다.


하지만 이에 비해 대안 데이터는 수집에 필요한 비용이 저렴하고 API 등 새로운 수집 방식을 이용할 수 있어 데이터 취득이 용이하다는 장점이 있습니다.

 API(Appication Programming Interface)는 '데이터 수집기관과 제공기관 간에 정해진 약속에 의해 데이터를 서로 주고받을 수 있도록 만들어놓은 규격화된 양식'을 의미


때문에 대안 데이터를 활용하는 경우에는 금융거래 데이터와 같은 표본조사(sampling) 방식 아니라 전수 자료활용하기도 하고, 인과관계가 아닌 상관관계를 적용하는 등 기존과는 다른 방식이 동원되기도 합니다.


결국 대안 데이터는 기존 금융거래 데이터에는 없던 정보를 제공하며, 특히 금융거래 이력이 없거나 부족한 개인과 기업에게 유용합니다. 기술의 발전과 함께 신용평가에 쓰일 수 있는 다양한 데이터 원천이 발굴되면서 대안 데이터의 종류는 계속 늘어나고 있으며, 활용방법도 진화해가고 있습니다.



신용평가모형에서의 대안 데이터 활용


신용평가모형에서 대안 데이터는 기존 금융거래 데이터의 '대체재' 혹은 '보완재'로서 다음의 3가지 형태로 활용되고 있습니다.


첫째, 대안 데이터가 단독으로 쓰이는 경우입니다. 금융 인프라가 제대로 갖춰지지 않은 나라금융소비자의 대다수가 금융거래 데이터가 없거나 부족한 경우가 많습니다. 때문에 이런 나라들에서는 대안 데이터를 단독으로 평가에 활용하기도 합니다.

대표적으로는 Lenddo라는 대안신용평가회사가 있는데, Lenddo는 금융거래 데이터가 거의 존재하지 않는 아프리카나 동남아 국가의 금융소비자를 위해 대안신용평가 점수인 'Lenddo Score'를 개발하고 이를 통해 기존 신용평가모형으로는 금융거래를 하지 못했던 사람들의 금융접근성을 높이고 있습니다.


둘째, 기존 신용평가모형의 보조 지표로 사용되는 경우입니다. 금융 인프라가 잘 갖춰져 있는 나라들에서도 금융거래 이력이 없거나 신용평가에 활용할 수 있는 데이터가 부족한 차주를 평가하기 위해서는 금융거래 데이터만을 이용한 신용평가모형으로는 한계가 있습니다. 이런 경우는 보조 지표로 대안 데이터를 활용하여 no-filer, thin-filer라 불리는 금융거래 이력 부족 차주들의 신용평가를 지원하게 됩니다.


셋째, 평가대상 중 일부 그룹에 대한 세분화 작업을 위해 사용되는 경우입니다. 일부 고신용자 그룹이나 저신용자 그룹의 경우, 평가대상이 특정 구간에 집중되어 있어 세분화가 필요한 경우가 있습니다.


예를 들어, 신용평점이 900~1000점 구간이나 500점 미만 구간의 경우, 고신용자 혹은 저신용자가 밀집되어 있어 해당 구간 내에서는 금융거래 데이터만으로 어떤 특성을 가진 차주를 선별해 내기는 어렵습니다. 이때 대안 데이터를 추가로 활용하여 해당 구간의 차주들세분화하기도 합니다.


우리나라에서 대안 데이터를 활용하는 형태는 주로 두 번째와 세 번째 경우입니다. 먼저 기존 신용평가모형의 보조 지표로 사용되는 경우에는 대안 데이터만을 위한 별도의 신용평가모형을 만들어 그 결괏값을 기존 모형과 비교하거나, 기존 모형의 결괏값에 가점을 부여하는 방식으로 대안 데이터를 활용하기도 합니다.


또한 특정 그룹을 대안 데이터를 활용하여 좀 더 세분화하게 되면, 저신용자 그룹 중 위험도가 높은 차주를 정밀하게 선별해 낼 수 있고, 고신용자 그룹 중 상대적으로 좀 더 우량한 특정 그룹의 차주를 타깃 마케팅할 수도 있어 금융회사의 리스크 관리나 수익성 향상에도 도움을 줄 수 있습니다.


※ 이 글의 상당 부분은 제 박사학위 논문인 "An Empirical Study on Credit Evaluation Model for Sole Proprietor based on the Reference Model"의 내용을 인용하였습니다.



다음 편에서는 방법론 관점에서의 신용평가모형의 미래에 대해 말씀드리겠습니다.

이전 08화 그 밖의 신용평가모형들
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari