brunch

You can make anything
by writing

C.S.Lewis

by 박경아 Feb 26. 2021

쉽게 이해하는 빅데이터 (3)

3. 데이터를 분석하는 방법

앞서 데이터의 중요성에 대해 이야기했다면 이제 실제 데이터를 분석하는 방법들에 대해 알아 보고자 한다.데이터 분석이란 데이터로부터 인사이트를 도출하는 과정으로, 분석을 위한 방법으로 통계, 시각화, 머신러닝, 딥러닝  등이 있다.


쉽게 이해하는 빅데이터


챕터 1. 빅데이터가 바꾸는 세상

챕터 2. 빅데이터란 무엇인가

챕터 3. 빅데이터를 분석하는 방법

- 통계

- 시각화

- 인공지능 (연역적 추론)

- 인공지능 (귀납적 추론)

- 머신러닝의 종류

- 데이터 분석 프레임워크(Framework)

- 딥러닝

- 머신러닝 vs. 딥러닝 차이

챕터 4. 데이터 유능감을 기르자.


머신러닝 알고리즘을 적용하기 전에 기본적인 통계를 이용해서 데이터를 요약하고 파악할 수 있다. 파이썬에서도 넘파이라는 통계 라이브러리를 제공한다.


알고리즘을 적용하기 전에 데이터들의 특징이나 데이터들 간의 상관관계 등 직관적으로 데이터를 이해할 수 있다. 무엇을 더 분석하고 싶은 지에 대한 아이디어가 떠오를 수도 있다.


연역적 추론 기반 인공지능은 걷기, 운전하기, 잡담하기 등 우리가 힘들이지 않고 잘하는 암묵지를 명제로 변환하는 것이 어렵다.


사람은 개와 고양이의 특징을 배우지 않아도 개와 고양이를 구분한다. 컴퓨터를 사람처럼 많은 양의 데이터로 학습시키는 것을 머신러닝 또는 기계학습이라고 한다.




딥러닝은 기본적으로 인간의 뇌는 지능이 있으니 사람의 이것이 어떻게 운영되는 지 분석하고 따라 해보자는 생각에서 출발했다.


귀납적으로 데이터로부터 배우는 것은 머신러닝과 동일하지만 머신러닝의 경우 사람이 입력값이나 결과값을 설정한다면 딥러닝은 분류에 사용할 데이터를 스스로 학습한다.


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari