brunch

You can make anything
by writing

C.S.Lewis

by HANNS Jul 28. 2016

핀테크 하면 생각나는, 빅데이터

열한 번째 이야기


오늘은 핀테크 하면 생각나는 용어죠. 바로, 빅데이터에 대해 알아보겠습니다.




우선 빅데이터의 정의에 대해 알아볼까요?

사전적 의미로는 기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 정형 및 비정형 데이터들을 의미하는데요.


예를 들어, 구글에 존재하는 모든 이미지 파일을 생각해 보시면 돼요. 너무나 많은 이미지가 존재하다 보니 어떤 이미지들이 존재하는지, 각각의 이미지는 어떻게 분류해야 하는지 점차 모호해지죠. 이러한 막대한 양의 데이터들을 빅데이터라고 합니다.


'고양이'라고 검색하면 나오는 막대한 양의 구글 이미지


그렇다면 이 빅데이터가 왜 핀테크에서 주로 이용되는 것일까요?

예를 들어, 은행이 가지고 있는 고객 데이터들이 점차 비대해지고 이를 사람이 분석하고 처리하기가 점점 어려워지고 있어요. 이를 잘만 활용하면 고객의 성향에 맞춘 상품을 추천할 수도 있고, 앞으로 어떤 상품을 만들어야 할지 예측할 수도 있게 되죠. 그래서 이 막대한 데이터들을 컴퓨터가 분석하고 처리할 수 있도록, 핀테크 플랫폼을 통해 활용하게 되는 것이에요. 즉, 핀테크 플랫폼은 금융사에서 빅데이터를 분석하거나 활용하는 데 필요한 필수 인프라로 활용된다고 보시면 됩니다.


이러한 빅데이터를 플랫폼은 다음과 같이 크게 2가지 기능을 가지고 있어야 합니다.


1) 빅데이터 수집 : 고속으로 저장하고 대용량의 저장 공간을 갖춰야 해요.

2) 빅데이터 분석 : 빅데이터를 처리하여 분석하고 이를 시각화하는 기술이에요.


이 두 가지 중에 핵심은 빅데이터 관리입니다. 어떻게 분석하느냐에 따라 결과가 달라지기 때문에 여러 가지 기술이 사용되고 있어요.


그리고 대표 소프트웨어로는 하둡의 맵리듀스 그리고 마이크로소프트의 드라이 애드가 있습니다.


맵리듀스의 개념 : 얽혀진 데이터 들을 Map, Shuffle, Reduce 과정을 통해 분류


1) 맵리듀스 : 대용량 로그파일 처리 프레임워크

2) 드라이 애드 : 실시간 스트림 처리 기술


이러한 소프트웨어의 대표 기술로는 다음과 같이 분류됩니다.

비정형 데이터의 패턴과 관계를 분석하는 기술들(출처 : SK플래닛 기술 블로그)


1) 데이터 마이닝 : 많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정

2) 텍스트 마이닝 : 비정형 텍스트 데이터에서 새롭고 유용한 정보를 찾아내는 과정 또는 기술로서, 자연어 처리라고 생각하시면 쉽습니다.

3) 오피니언 마이닝 : 웹사이트와 소셜미디어에 나타난 여론과 의견을 분석하여 유용한 정보로 재가공하는 기술



이뿐만 아니라 빅데이터는 폐기도 중요합니다. 데이터들이 여러 곳에 분산되어 저장돼 있을 경우 폐기가 제대로 이루어진지 확인하기 어렵기 때문이죠.


실제로 이런 기술을 은행권은 어떻게 활용하고 있을까요?

은행에서는 주로 빅데이터를 고객관계 관리(CRM) 시스템에 사용하는데요. 이뿐만 아니라 이를 바탕으로 다양한 상품 개발에 열을 올리고 있습니다.


CRM : 고객 정보를 바탕으로 고객 욕구와 성향을 충족시켜 기업 목표를 달성하는 마케팅 기법
빅데이터 기반을 통해 CRM 활동을 강화(출처 : 한국테라데이타)


그리고, 은행의 빅데이터 인프라를 통한 주요 개발 내용으로는

1) 내부 비정형 데이터의 수집 및 저장 등 분석 환경 구축

2) 웹로그 분석을 통해 사용자 환경 구매 지표 구현

  웹로그 분석 : 웹 사이트의 방문객이 남긴 자료를 근거로 웹의 운영 및 방문 행태에 대한 정보를 분석

3) 영업점 상당/섭외 텍스트 분석을 통한 이탈 고객 및 여신 가망 고객군 발굴

여신 : 금융 기관에서 고객에게 돈을 빌려주는 일


등이 있습니다.


우리나라는 IT강국이기에 흔히들 ‘빅데이터의 금광’으로 불리는데요. 빅데이터의 빠른 분석과 획기적인 아이디어를 통해 대한민국이 핀테크 강국으로 성장하길 바라봅니다.


이번 시간은 핀테크 하면 떠오르는 빅데이터에 대해 알아보았습니다. 다음 시간에는 최근 은행권의 주요 관심사인 핀테크 오픈 API에 대해 알아보겠습니다. 감사합니다.

매거진의 이전글 만들어가는 금융, 크라우드 펀딩
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari