brunch

You can make anything
by writing

C.S.Lewis

by SSEN Dec 13. 2022

데이터 스토리텔링 연습!_Day 30

전문용어에 주눅 들지 않는 법


전문용어, 괜히 주눅 드는 그것.

특정한 영역의 데이터를 다루는 그래프들에는 전문 용어나 지표들이 자주 등장합니다. 다행히 평소에 들어본 단어이거나 익숙한 내용이라면 큰 문제없이 넘어갈 수 있겠지만 잘 모르는 내용이라면 그래프를 뜯어보기도 전에 피곤해질 것입니다. 이번 그래프가 그랬는데요.

운 좋게도 제가 평소에 들어본 단어가 있었습니다. 바로 LTV라는 용어인데요. 주택의 가치, 즉 금액에서 대출을 받을 수 있는 금액의 비율입니다. 1억짜리 주택에서 LTV가 0.4라면 40퍼센트인 4천만 원까지는 주택담보대출이 가능하다는 이야기입니다. 

그러나 운 좋게 단어 하나를 안다고 해도 한참 그래프를 봐야 무슨 이야기를 하는 건지 가닥을 잡을 수 있었습니다. 그래프의 이해가 어려운 것은 아무래도 이중축의 영향이 큰데요, 붉은색(실제)과 파란색(모델) 꺾은선 그래프는 왼쪽의 대출금을 갚은 사람들의 비율인 Vol_prepay_.. 축을 다릅니다. 용어 사이에 언더바(_)가 있는 것으로 보아 그래프를 그린 툴이 전문 프로그래밍 언어를 사용하는 것일 가능성이 높습니다. 


UPB라고 표시되어 있는 녹색의 점선은 x 축인 ltv_bin의 값이 높아질수록 점점 높아졌다가 일정 이상 높아지면 다시 낮아지는 것을 볼 수 있습니다. 저는 ltv 0.4-0.7 정도 구간까지 대출 원금이 늘어난다, 즉 대출이 늘어난다로 파악했습니다.



같은 x축의 그래프 분리하기

내용 이해가 조금 어려워서 책의 해석을 빌려 수정해보았습니다. 

 

전문용어가 익숙하다면 그래프의 의도나 방향은 파악하기 쉬울 수 있습니다. 그러나 잘못하면 그래프 자체가 설명하는 내용 이상으로 깊숙이 빠져들 수도 있습니다. 책의 내용을 확인해본 결과 이 그래프에서의 포인트는 [일정 구간에서 모델과 실제의 상환율은 다르다] 였는데요, 저는 대출금과 상관관계가 있나 헛다리를 짚은 셈이었습니다. 


수정한 그래프는 같은 x축을 가지고 있습니다. 그러나 모든 내용을 한 그래프에 넣기엔 이중축이 마음에 걸려서 위아래로 분리해서 배치했습니다. 아래 그래프인 미지급 원금잔액 그래프는 꺾은선 그래프를 유지할 경우 아래로 내려갈수록 수치가 낮아지는 것처럼 보일 것 같아서 막대그래프로 변경했습니다.

여기에 실제에 비해 모델이 과대평가/과소평가 한 구간, 대출금 집중 영역의 구간을 표시해서 두 그래프에 통일된 부분을 표시했습니다. 임의적으로 그래프를 위아래로 붙이다 보니 약간의 차이는 생겼네요. y축의 값이 들어가는 공간 때문에 생긴 차이인데 이 부분은 고칠 수 있는지 고민해 봐야겠습니다.


오늘도 도움이 되셨길 바랍니다. 


이외에도 작성방법과 다양한 템플릿이 궁금한 분들은 아래의 뉴스레터 신청을 클릭해 주세요. 템플릿에 대한 정보와 곧 열리게 될 온라인 템플릿 제작 강의에 대한 정보를 받아보실 수 있습니다.


멈추지 말고 문서를 그리세요.


감사합니다.



★이 컨텐츠는 데이터 스토리텔링 연습!(콜 누스바우머 내플릭 지음 | 변혜정 옮김 | 에이콘출판 | 2021.06.30 출간)의 연습문제를 푸는 형식으로 진행되고 있습니다. 원본의 데이터는 책에 포함된 문제들이며 포스팅하는 이미지들은 제가 새롭게 제작한 것입니다.


★한 달에 두 번 - 둘째, 넷째 주 월요일에 파워포인트 비즈니스 문서 디자인에 대한 노하우를 공유합니다.

필요하신 분들은 이 링크에서 비즈니스 콘텐츠를 신청해 주세요.(클릭) 포스트 발행과 무료 자료 발행 시 이메일로 보내드리겠습니다.


Copyright 2021.(KIM SENA) All pictures cannot be copied without permission

매거진의 이전글 데이터 스토리텔링 연습!_Day 29
작품 선택
키워드 선택 0 / 3 0
댓글여부
afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari