두 번째 챕터는 그렇다면 빅데이터란 무엇인가에 대해서이다. 빅데이터의 특징은 우선 양(Volume)이 많다는 것이다. 많다는 것이 어떤 수치적인 기준이 있는 것이 아니라 기존의 회사 IT 설비로는 감당하기 어려운 수준을 말한다. 그리고 실시간으로 끊임없이 발생해 생성속도가 빠르고, 숫자와 같은 정형화된 데이터 말고도 텍스트, 이미지, 동영상 등 데이터들이 다양하다(Variety)는 점이다. 즉, 실시간으로 끊임없이 발생되는 아주 많은 양의 다양한 데이터라고 할 수 있다.
인공지능 이론은 이미 1970년, 80년대에도 존재했지만 그 때만 해도 분석할 빅데이터가 없어 한 동안 ‘소외된’ 학문이었다고 한다. 하지만, 최근 들어 스마트폰, 소셜 미디어, 사물 인터넷 등이 만들어 내는 어마어마한 데이터와 그리고 이를 처리할 컴퓨터 계산능력이 획기적으로 발전하면서 4차 산업혁명의 기반기술이 되고 있다.
쉽게 이해하는 빅데이터
챕터 1. 빅데이터가 바꾸는 세상
챕터 2. 빅데이터란 무엇인가
빅데이터의 3가지 특징
빅데이터 소스
빅데이터 활용법 (1)
빅데이터 활용법 (2)
빅데이터 활용법 (3)
챕터 3. 빅데이터를 분석하는 방법
챕터 4. 데이터 유능감을 기르자.
내비게이션을 켜면 비교적 덜 막히는 곳으로 길을 안내하는 데, 서비스 업체는 우리에 앞서서 달리는 차들의 시간당 위치변화를 실시간으로 분석해 우리에게 안막히는 길을 알려준다.
아마존은 "당신이 구매하기도 전에 당신에게 배송하고 싶다"는 선도적인 마케팅을 준비하고 있다.
다이킨은 실내기, 실외기라는 제품이 아닌 "우리가 이 건물을 전기요금을 포함해 월 사용료 얼마에 1년 내내 22도에서 25도로 유지해주겠다"라는 서비스를 팔고 있다.
기존 플래티넘 사용자의 특징을 분석하고 이와 유사한 특징을 가진 사람들을 머신러닝 모델 방법 중에 하나인 의사결정 나무를 적용해 분류해 낼 수 있다.