4차 산업혁명 용어들 야매로 부수기
빅데이터, IoT, AI, 클라우드 컴퓨팅이 4차 산업혁명의 신 성장동력이 될 것입니다. 미래창조과학부는 이를 위한 투자를 아끼지 않을 것이며..
언제부턴가 인공지능이나 사물인터넷, 빅데이터와 같은 용어들을 쉽게 볼 수 있습니다.
문제는.. 각 기업들이 서로 다르게 정의하고 있고..
서로 개념이 겹치기도 하고..
전문용어로 뒤덮여있다보니 좀처럼 이해하기 힘듭니다.
특히나 바둑으로 세간을 떠들석하게 했던 알파고,
그리고 영화감독들의 상상력 덕분에 아직 AI라는 단어를 들으면
이런걸 떠올리는 사람들이 더 많은 듯 합니다:(
최근 기술혁신에 관한 개념과 사례에 대해 정리하고 있는데요.
오늘은 그 시작으로 빅데이터, IoT, AI, 클라우드 컴퓨팅의 연관성에 대해 정리해봤습니다.
이해를 돕기위해 각각의 기술들을 일방적인 인과관계처럼 설명했는데요.
(IoT -> 빅데이터 -> AI -> 클라우드컴퓨팅)
하지만 각각의 기술은 상호의존적인 관계라는 점,
그리고 이 설명은 극히 일부분이라는 점 참고해주세요!
Internet of Things, 기기들이 인터넷을 통해 연결된 것.
가장 먼저 소개할 IoT는 말 그대로 사물들이 인터넷을 통해 서로 연결된 것을 말합니다.
IoT를 활용한 사례는 정말 방대한데요. 홈 IoT 서비스의 경우 무더운 여름 귀갓길에 에어컨을 미리 켜서 집을 시원하게 할 수 있고요. 아마존 에코처럼 간단한 대화를 통해 제품을 주문할 수도 있습니다.
이런 IoT 제품들은 향후 자동차(스마트 카)를 넘어 도시(스마트 시티)까지 퍼져나갈 것이라고 하는데요. 전문가들의 예측에 따르면 IoT 기기들은 2020년까지 307억개, 2025년까지 754억개가 될 것이라고 합니다.
이렇게 다양한 기기들이 인터넷을 통해 연결되자 엄청난 양의 데이터가 쌓이기 시작했습니다. 이들은 기존의 기술로 분석하기 힘들 정도로 늘어나는데요. 이러한 방대하고 복잡한 데이터, 그리고 그를 다루는 기술이 바로 빅데이터입니다.
방대한 양, 복잡한 형태의 데이터 혹은 그 데이터를 활용하는 기술
데이터를 다루는 것은 사실 오래전부터 있었던 일입니다.
한 대형마트 주인을 예로 들어보겠습니다. 이 주인이 맥주 판매량을 엑셀에 정리해봤더니 ‘여름에는 맥주 판매량이 늘어난다.’는 사실을 알 수 있었습니다. 주인은 이를 활용하여 여름에 더 많은 맥주를 진열했고 판매를 증가시킬 수 있었습니다. 이렇듯 데이터는 과거부터 의사결정/미래 예측 등에 중요한 근거가 됐습니다.
그런데 인터넷이 발달하면서 이 '맥주 판매량'과 같은 데이터가 엄청나게 늘어났습니다. 기업들은 앞서 언급한 IoT 기기에서 뿐만 아니라 아니라 카드결제, GPS, 검색 기록 등 고객들의 다양한 행동을 실시간으로 기록할 수 있게 되었죠. 게다가 기술의 발달로 숫자가 아닌 SNS게시글, 사진, 영상 등의 데이터도 활용할 수 있게 되었습니다. 이렇듯 수시로 쏟아지는 어마어마한 양, 다양한 형태의 데이터를 빅데이터라고 부릅니다.
이제 대형마트 주인은 맥주 판매량뿐만이 아니라 주요 고객들의 검색기록, 구매이력, SNS에 올린 글을 알 수 있습니다. 또 이를 활용하여 전보다 확실하게 판매를 촉진하거나 생산성을 높이는 등의 전략을 취할 수 있게 되었죠. 이렇게 엄청난 양의 데이터를 분석하여 새로운 가치를 창출하는 것이 인공지능의 역할입니다.
*자주 나오는 용어 뜻
정형데이터 : 엑셀처럼 고정된 필드에 저장된 데이터
비정형 데이터 : SNS 게시글, 유튜브 동영상, PDF, 워드, 사진 파일 등 고정된 형태가 아닌 데이터
3V : 빅데이터의 3가지 특징, 빠른 속도(Velocity), 많은 양(Volume), 다양함(Variety)을 말함
ex) 정형데이터와 비정형데이터의 집합 혹은 그를 활용하는 기술을 말하는 빅데이터는 3V의 특징을 가진다.
인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술
인공지능은 다양한 방법으로 활용됩니다. 가장 대표적인 방법은 ‘미래를 예측하는 것’인데요.
오래전 맥주 판매량 엑셀로 전략을 짜던 대형마트 주인은 이제 웹서비스를 만들어 고객의 구매기록, 위시리스트, 마우스 커서가 위치했던 시간도 분석할 수 있습니다. 인공지능을 활용한다면 이 대형마트 주인은 고객들이 다음에 주문할 상품을 예측할 수 있고 이들을 미리 준비해서 배송시간을 줄일 수 있죠. 아! 이건 실제로 아마존이 실행하고 있는 전략입니다.
물론 이 뿐만이 아닙니다. 빅데이터와 AI는 컴퓨터의 ‘판단’에도 활용됩니다.
최근 이슈가 되고있는 자율주행 자동차가 이런 종류입니다. 자동차가 ‘보행자’나 ‘신호등’등의 정보를 인식하여 자율적으로 주행할 수 있게 만드는 것이죠.
이런 AI를 실현시키기 위해 우리는 컴퓨터에게 엄청난 양의 ‘신호등’과 ‘보행자’ 사진을 보여줘서 학습시켜야 하는데요. 머신러닝이라고 불리는 이러한 과정을 지나야 컴퓨터(자율주행자동차)는 비로소 카메라로 보행자와 신호등을 인식할 수 있습니다.
문제는 이런 엄청난 양의 데이터를 어디에 저장하고 어떻게 분석하냐는 겁니다. 엑셀이나 다룰 수 있었던 작고 귀여운 노트북은 이런 데이터를 다루기엔 부족했죠. 그를 해결한 개념이 바로 클라우드 컴퓨팅입니다.
*자주나오는 용어 뜻
머신러닝 : 사람이 학습하듯이 컴퓨터에도 데이터를 줘서 새로운 지식을 얻어내게 하는 분야.
딥러닝 : 기계에 데이터를 주기 전에 라벨링을 하지 않고 기계 스스로 데이터를 군집화 / 분류하는 기술
컴퓨터비전 : 컴퓨터가 사진과 영상에서 객체를 인식하도록 도와주는 기술, 자율주행자동차 등에 활용
자연어처리 : 인간의 언어를 기계가 알아듣고 처리할 수 있게 만드는 기술, 번역/음성인식/챗봇 등에 활용
ex) 고양이와 강아지를 인식하는 컴퓨터비전 기술의 핵심은 머신러닝이다.
인터넷 상의 서버를 통하여 데이터 저장, 네트워크, 콘텐츠 사용 등 IT 관련 서비스를 한번에 사용할 수 있는 컴퓨팅 환경이다.
클라우드 컴퓨팅은 정보의 저장과 처리를 제 작고 귀여운 컴퓨터가 아닌 인터넷에 연결된 다른 컴퓨터들이 대신 해줄 수 있도록 도와줍니다.
간단히 말해 개인 PC로 30년이 걸릴 분석을 구글이나 아마존같은 기업들이 100배 빠른 컴퓨터 100대를 써서 3일만에 처리해주는 거죠. 그를 위해 제가 해야할 일은 구글/아마존의 컴퓨터에 원격으로 접속해서 명령을 내리는 것이 다입니다.
모든 회사들이 빅데이터를 분석하기위해 저장장치를 만들고 각자의 컴퓨터에서 분석을 했다면 막대한 비용이 들어갔을 것입니다. 하지만 클라우드 컴퓨팅은 이런 정보와 기반시설을 공유하여 빅데이터를 활성화시켰습니다.
*주요 용어 설명
분산처리 : 여러 컴퓨터가 한 작업을 나눠서 처리하는 것.
가상화 : 여러개의 서버, 네트워크를 하나인척 혹은 하나의 서버를 여러개인척 해서 효율성을 높이는 기술
기술쪽 공부를 하다가 오랜만에 돌아왔습니다!
그동안 글을 쓸법한 이슈가 너무 많이 쌓였네요.
다음 포스팅에서는,
아마존마저 부러워하는 리테일 테크의 아이콘 영국의 신선식품 유통기업 ‘오카도’에 대해 알아보겠습니다.