brunch

You can make anything
by writing

C.S.Lewis

by Ryan Choi Nov 12. 2023

개인 신용평가모형의 데이터와 방법론

개인 신용평가모형 (2)

개인 신용평가모형에서 활용되는 데이터


개인 신용평가모형의 목표는 특정 개인에 대한 채무상환 가능성을 확률로 나타내고, 이 확률을 직관적으로 확인하기 쉽게 점수화하는 것입니다.


일반적으로는 연체 경과일이 90일 이상이 된 채무의 연체를 '돈을 갚지 않고 있는 상태', 즉, '무상환 불이행'으로 판단하며, 주로 과거와 현재의 금융거래 이력 정보를 바탕으로 향후 1년 이내의 90일 이상 연체 가능성을 예측하게 됩니다.


이를 위해 국내외 개인 신용평가회사에서는 상환이력, 부채수준, 신용거래 기간, 신용형태 등을 주요 평가항목으로 활용하고 있습니다. 또한 회사별로 모형의 평가항목 내 세부 변수와 각 변수별 가중치는 각기 다르기 때문에, 동일한 개인이라 할지라도 모형이 다르면 신용평점도 다르게 산출될 수 있습니다.


최근에는 건강보험 및 국민연금 납부내역, 통신료 및 공공요금 성실납부 정보 등을 추가로 제출하거나, 개인의 동의를 거쳐 관련 데이터를 수집한 후, 이를 추가로 반영하여 평가에 활용하기도 합니다.  


평가항목별 활용비중 (Source: FICO, NICE평가정보, KCB)


한편, 은행과 같은 금융회사에서는 개인 신용평가회사에서 사용하는 변수 외에도 평가대상 개인의 소득, 성별, 연령, 직업, 금융자산 등 더 많은 정보를 보유하고 있기 때문에 이러한 정보들을 추가로 평가에 활용하기도 합니다. 또한 금융회사별 여신 정책(예: 주거래 은행이거나 해당 은행과 거래기간이 긴 경우)에 따라 일부 고객에게는 점을 부여하는 경우도 있습니다.


개인 신용평가시 구체적으로 어떤 세부 변수를 사용하는지, 변수별 가중치는 어느 수준으로 부여하는지 등에 대해서는 각 회사별 영업비밀이며, 평가대상인 개인에게 공개되어서는 안 되는 것이 원칙입니다.


그 이유는 어떤 변수를, 어느 정도의 가중치에 따라 평가에 활용하는지 등의 내용이 담긴 신용평점 부여 규칙(평점표)이 공개되면, 평가대상인 개인이 이 규칙을 파훼하여 자신의 신용평점을 높이기 위한 조작 행위를 할 우려가 있기 때문입니다. 


만약 이런 왜곡이 발생하게 되면, 모든 신용평가 결과를 신뢰할 수 없게 되어 우리나라의 금융질서를 파괴하는 심각한 결과를 초래하게 되므로 주의해야 할 것입니다.


다만, 앞으로의 글에서 - 각 회사들의 영업비밀이 침해되지 않는 범위 내에서 - 개인이 신용평점을 관리할 수 있는 몇 가지 팁을 조심스럽게 공개해보려 합니다. 



개인 신용평가모형의 방법론


개인 신용평가모형 개발 시에는 로지스틱 회귀 방법론(Logistic Regression)가장 많이 쓰입니다.


이 방법론은 대표적인 분류 모형(Classifier)으로서, 독립변수들의 선형 결합을 이용하여 종속변수(Y)와 독립변수(X)의 관계를 함수 식으로 표현할 수 있으며, 종속변수가 0 또는 1의 이진(Binary) 형태경우에 유의한 독립변수를 식별하고, 모형에서 산출된 종속변수 값을 기준으로 분류를 하고자 할 때 주로 활용됩니다.


이 방법론으로 모형을 만들게 되면, 독립변수의 값이 어떤 범위에 속하든지 상관없이, 종속변수의 값은 항상 0에서 1 사이에 존재하도록 만들어주며, 함수 식은 오즈(Odds)를 로짓 변환(Logit Transformation)함으로써 얻어집니다.

오즈(Odds)는 어떤 사건이 발생할 확률을 p라고 했을 때, 어떤 사건이 발생하지 않을 확률인 1-p 대비 발생할 확률 p의 값, p ÷ (1-p)를 의미하며, 로짓(Logit)은 오즈에 로그를 취한 것을 말합니다.


따라서 이 방법론으로 개인 신용평가모형을 만들게 되면, 종속변수를 '정상'인 경우를 0, '채무상환 불이행'인 경우를 1로 표현하여 모델링하기에 용이하며, 다른 방법론 대비 개발과정이 간편하고 개발 이후 모형에 대한 해석이 용이하다는 점이 장점이라 할 수 있습니다.


로지스틱 회귀 방법론 기반으로 모형을 만들게 되면, 모형의 결과값인 채무상환 불이행 가능성이 확률로 산출되는데, 예를 들어, 채무상환 불이행 가능성이 0.613이라고 한다면 이에 따른 신용평점은 1,000점 만점을 기준으로 (1-0.613) x 1,000 = 387점이라고 생각할 수 있습니다.


다만 기본적인 개념은 이렇지만, 실제 신용평점은 실무적으로 평점표에 의해 산출되기 때문에, 현실에서 이렇게 계산되지는 않습니다. 기본 점수가 있고, 연체 이력이 존재하는 개인과 그렇지 않은 개인 간에는 신용평점 구간의 차등을 두어야 하는 등 실제 적용 시 고려해야 할 점이 기 때문입니다.


따라서 채무상환 불이행 가능성을 평가한 확률과 실무 적용에 따른 고려사항을 반영한 평점표(Scorecard)가 만들어지게 되며, 각 항목별 점수를 합산한 결과를 가지고 개인별 신용평점이 산출됩니다.


아래 그림은 예시로 보여드리는 일반적인 평점표(Scorecard) 형태입니다.


평점표(Scorecard) 예시



다음 편에서는 기업 신용평가모형에 대해 말씀드리겠습니다.

이전 04화 개인 신용평가모형의 개념과 발전
brunch book
$magazine.title

현재 글은 이 브런치북에
소속되어 있습니다.

작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari