brunch

매거진 The VIBE

You can make anything
by writing

C.S.Lewis

by 전영환 Jul 25. 2018

데이터(Data)의 인식

[說]정보(情報) with The VIBE _ 첫번째

요즘은 정말 빅데이터의 시대입니다. 실제로 기술의 발전과 함께 엄청난 양의 데이터들이 쌓여가고 있습니다. 이 데이터를 기반으로 추출된 정보를 이용한 서비스 및 제품들이 많습니다. 우리가 실제로 체감하고 있던 아니던 우리는 이미 데이터의 시대에서 살아가고 있습니다.


주변을 둘러보면 데이터에 대한 이야기가 많이 들립니다. 데이터를 기반으로 한 각종 서비스들, 4차 산업혁명이 일으키는 변화, 빅데이터 시대의 흐름 속에 각자가 가져야 할 역량 등 다양한 주제들에 대한 이야기들이 넘쳐납니다. 


이번엔 그중에서도 데이터가 정보화되는 과정에 있어, 가장 기본적인 부분에 대해서 이야기해보고자 합니다. 데이터라는 것은 어떻게 표현할 수 있는지, 데이터라는 것은 "우리는 그리고 인공지능은" 어떻게 인식을 해서 정보화하는지에 기본적인 부분부터 알아가 보고자 합니다.



1. Data Representation


Data Representation은 데이터를 이해하고 사용하는데 가장 기본이 되는 첫 과정입니다. 데이터를 다루고 실제적으로 사용하기 위해서는 데이터를 어떠한 형식으로 표현할 수 있어야 합니다. 데이터는 어떻게 표현이 되고, 표현하기 위해서 어떠한 것이 방법이 사용되는지 알아가 보고자 합니다. 가장 기본이 되는 Vector, Entropy, Embedding 등에 대해 알아보고자 합니다.



Vector Embedding in Vector space



2. Data의 종류별 인식


데이터에는 다양한 종류가 있습니다. 데이터를 특징, 출처, 형태 등 다양한 방식으로 분류할 수 있습니다. 이번에는 데이터의 형태를 기분으로 분류하여 접근하고자 합니다. 데이터의 형태에 따른 데이터의 특성을 파악하고, 특정에 따라 "사람은 그리고 인공지능은" 어떻게 인식을 하는지에 대해 알아보고자 합니다. 이 데이터별 인식의 방법을 Model에 어떻게 녹여내어 인공지능을 구현하고 있는지 얘기해보고자 합니다.

가장 기본적인 형태의 User Behavior 데이터, 변형(Deformation)에 강한 Image 데이터,  흐름의 관계가 있는 Text 데이터에 대해 알아보려 합니다. 이러한 데이터가 실제로 어떠한 Task에서 활용되고 있는지, 우리 주변에서 흔히 접할 수 있는 사례를 통해 데이터의 인식 과정을 집어보고자 합니다.


User Behavior, Image, Text


앞으로도 "[說]정보(情報) with The VIBE"는 정보와 데이터에 대한 다양한 주제로 있을 예정입니다. 많은 관심 부탁드립니다.


soon. with The VIBE



브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari