brunch

You can make anything
by writing

C.S.Lewis

by 김시바 Jan 22. 2020

데이터 3법의 개정과
마이데이터 산업의 의미

데이터 3법은 개인정보 보호법 · 정보통신망법 · 신용정보법 개정안을 줄여 부르는 말로써 핵심은 사람들의 정보를 안전하게 가명으로 처리하면 정보를 제공한 사람의 동의 없이도 정보를 활용하여 연구하거나 서비스, 기술 개발 등에 사용할 수 있도록 하는 것입니다.


현재 인공지능 시스템을 개발할 때 주로 사용하는 머신러닝과 딥러닝 기술은 다양하고 많은 데이터가 필요한 것이 특징입니다. 그런데 이렇게 다양한 데이터들은 보통 어느 한 기업에 전부 다 존재하는 것이 아니라 여러 분야의 기업들에 퍼져 있는 상태입니다. 예를 들면, 제 자동차를 운행한 정보는 SK텔레콤의 T-MAP에 쌓이고 있을 것이고, 제가 대중교통을 이용한 이력은 국토교통부 시스템이나 카드사 시스템에 쌓이고 있을 것이고, 제가 인터넷으로 쇼핑한 이력은 네이버에 쌓이고 있을 것입니다. 이러한 기업들은 서로 필요한 데이터를 주고 받아 분석하길 원하지만 기존에는 이렇게 데이터를 주고 받기 위해서는 정보를 제공하는 사용자들의 동의가 있어야만 했습니다. 하지만 이번 데이터 3법이 개정됨에 따라 해당 데이터의 주인이 누구인지 알아 볼 수 없게 조치하면 데이터를 기업들이 원하는대로 가공, 처리, 분석하고 거래도 할 수 있게 된 것입니다.


데이터 3법 주요 내용 ( 출처 : 대한금융신문 )


쉽게 예를 들자면, 보험회사에서 남성의 수명예측 인공지능을 만들고 싶다고 가정해보겠습니다. 이러한 인공지능을 만들기 위해서는 우선 어떤 요인들이 남성의 수명에 영향을 줄 수 있는지 분석하고 데이터를 준비해야만 합니다. 나이, 거주환경, 급여수준, 식습관, 주거환경, 교통수단, 직업 등이 필요하다고 가정하면 어떤 데이터는 보험회사가 직접 가지고 있을 수도 있고,  어떤 데이터는 식품 관련 회사에, 어떤 데이터는 부동산 관련 회사에 있을 수도 있습니다. 기존에는 이렇게 데이터들이 흩어져 있을 경우 서로 주고 받을 방법이 없었지만, 이제는 가명으로 처리하면 기업간 거래를 통해 흩어진 데이터를 한 곳에 모아 보험회사가 원하는 형태로 가공하고 분석할 수 있게 되었습니다.


이렇게 여러가지 데이터를 수십, 수백만건씩 모으면 비교적 정확도가 높은 정교한 인공지능을 만들 '가능성'이 높아지고 '속도'가 빨라집니다. 알파고가 처음에는 인간이 남긴 기보 수십만건을 바탕으로 학습을 하고, 나중에는 자체적으로 수립한 알고리즘간에 가상 대국을 시켜 다시 수천만번의 학습을 시킨 것처럼 말입니다. 다만, 요즘에는 이렇게 데이터를 모으는 것이 힘들다보니 데이터를 적게 학습시키고도 인공지능의 성능을 개선하는 연구도 활발히 일어나고 있습니다.


이제는 거의 모든 산업 분야에서 각 기업들이 원하는 인공지능을 개발하여 서비스 품질을 높이거나, 비용을 절감하려는 경쟁이 치열해질 것으로 예상됩니다. 클라우드 컴퓨팅, 구독경제, 디지털 큐레이션 마케팅 등 흔히 디지털 시대를 맞이하여 주목받고 있는 '사용한만큼 돈을 내는 서비스', '개인 맞춤형 서비스' 등은 모두 고객의 행동을 정교하게 예측할수록 기업의 비용이 절감되고 고객의 만족도가 올라갈 수 있는 서비스들입니다. 그래서 쿠팡과 같은 전자상거래 업체는 고객의 데이터가 쌓이면 쌓일수록 더 효율적인 재고 관리와 배송이 가능하다고 설명하고, 보험사들이 데이터가 많아질수록 고객의 수명과 발병확률을 정교하게 예측할 수 있어서 보험비를 좀 더 합리적으로 책정할 수 있다고 설명하는 것입니다.


소리로 차의 문제를 진단하는 인공지능 시스템 예시 (출처 : 현대자동차 그룹)


그리고 이렇게 개인별 맞춤형 서비스가 발전할수록 자신의 데이터를 관리하고, 자신이 원하는 기업에 데이터를 제공하여 맞춤형 서비스를 받는 '마이데이터' 산업도 활발해질 것으로 예상됩니다. 예를 들어, 기존에는 제가 어디에 어떤 데이터를 제공하고 있었는지 몰랐다면 앞으로는 데이터 관리 전문업체를 통해 여기저기 흩어져 있는 제 데이터들을 취합하여 관리하도록 위탁하고, 필요하면 새로 가입하는 서비스에 데이터를 제공하도록 지시하는 것이죠. 


( 출처 : 금융위원회 )


그렇다고 해서 당장 2020년 안에 엄청난 변화를 일으킬 수 있는 인공지능 서비스들이 쏟아져 나올 것이라는 이야기는 아닙니다. 머신러닝과 딥러닝 기술이 인공지능의 새로운 가능성을 열었던 것은 사실이지만, 그렇다고 해서 이것이 만능은 아니기 때문입니다. 지금까지 머신러닝과 딥러닝 기반 인공지능이 활약하고 있는 분야는 대부분 지금까지 이미 분석 방법이 나와 있었으나 컴퓨터의 계산 능력이 부족하여 이론을 현실화시키지 못했거나(바둑, 의료 등) 아니면 게임처럼 데이터를 수집/분석하고 학습을 시키기 쉬운 분야였습니다. 요컨대 데이터가 많아도 어떤 데이터를 어떻게 분석해야 되는지를 알아야만 데이터를 이용하여 정확도가 높은 인공지능을 만들 수 있는 것입니다.


그래서 2016년 알파고가 등장하여 온 세상이 당장 바뀔 것처럼 떠들썩하게 난리였지만 아직 일선 산업 현장에서는 머신러닝과 딥러닝 기반 인공지능이 대단한 성공을 거두지 못하고 있는 것이 현실입니다. 좋은 운동화가 준비되어 있어도 아직 달리는 법을 모르는 아기에게는 큰 의미가 없는 것과 같은 상황인 것입니다. 하지만 분명 적절한 준비가 되면 좋은 도구는 그 힘을 발휘하기 시작할 것입니다.


이전 04화 테크핀(TechFin) 기회일까? 위기일까?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari