brunch

You can make anything
by writing

C.S.Lewis

by 삼더하기일 Jul 12. 2021

빅데이터, AI랑 클라우드는 무슨 관계야?

빅데이터, AI 보편화를 촉발하는 클라우드

4차 산업혁명이라는 혁명은 단 하나의 기술로 탄생하게 된 것은 아니다. 빅데이터, AI, 클라우드, 자율주행, IoT, 블록체인 등 다양한 기술이 한데 모여 시너지 효과를 일으키며 산업 전체에 혁명을 일으킬 수 있다고 해서 붙여진 이름이다. 그렇기에 4차 산업혁명을 이루는 기술 요소들은 상호 간의 특정한 영향을 미치고 있다. 이전 글에서 살펴봤듯 빅데이터와 AI는 IoT와 중요한 연결성이 있었으며 자율주행은 곧 빅데이터 및 AI 기술로 이루어져 있었다. 그렇다면 클라우드는 어떨까. 예상 가능하겠지만 클라우드 역시 마찬가지로 빅데이터/AI와 깊은 관계를 이루고 있다. https://brunch.co.kr/@8d1b089f514b4d5/14https://brunch.co.kr/@8d1b089f514b4d5/26


클라우드도 빅데이터, AI랑 연관성이 있는 거야?


결론적으로 말하자면 클라우드와 빅데이터, AI는 밀접한 관계가 있는 것이 맞다. 조금만 더 구체적으로 말하면 클라우드가 빅데이터 및 AI를 활용하는 데 있어 사용성과 편리성을 엄청나게 높여주고 있다. 자율주행이 데이터와 AI를 기반으로 만들어진 것이었다면 그와는 조금 다르게 클라우드를 기반으로 빅데이터와 AI의 사용성이 매우 높아지고 있다고 볼 수 있다. 물론 클라우드라는 것이 없어도 빅데이터와 인공지능이라는 키워드가 사라질 가능성은 0에 가깝지만 클라우드를 빼놓고 빅데이터와 AI를 논하는 것은 요즘 시기에는 부적절하다. 그만큼 빅데이터와 AI를 활용하는데 하나의 '도구'로써 클라우드가 중요한 역할을 하고 있다.


우리는 쉽게 '클라우드'라는 말로 간편하게 표현하곤 하지만 클라우드의 정확한 명칭은 클라우드 컴퓨팅(Cloud Computing)이다. 사전적 의미로는 '사용자의 직접적인 관리 없이 특히, 데이터 스토리지와 컴퓨팅 파워와 같은 컴퓨터 시스템 리소스를 필요시 바로 제공(on-demand availability)하는 것'이라고 명시되어 있다. 쉽게 말하면 내 개인 PC를 이용해서 컴퓨터를 사용하는 것이 아니라 인터넷에 구현이 되어있는 컴퓨터 장치들을 이용해 그 기능을 내 개인 PC에서 이용하도록 하겠다는 것이다. 일반적인 클라우드 단어만 떠오르면 빅데이터 및 인공지능과의 연관성이 없어 보일 수 있지만 자세한 뜻을 알고 나면 확연히 달라진다.


클라우드 컴퓨팅의 사전적 정의 속에 왜 데이터 및 AI 생태계에 중요한 영향을 미치는지 다 드러납니다!


몇몇 사람들은 이미 눈치를 챘겠지만 클라우드 컴퓨팅의 사전적 정의만 살펴보더라도 왜 클라우드가 빅데이터, AI에 긍정적 영향을 미치고 있는지를 파악할 수 있다. 다시 한번 말하자면 클라우드 컴퓨팅의 사전적 의미는 '사용자의 직접적인 관리 없이 특히, 데이터 스토리지와 컴퓨팅 파워와 같은 컴퓨터 시스템 리소스를 필요시 바로 제공(on-demand availability)하는 것'이었다. 여기서 가장 중요한 키워드 두 가지를 볼 수 있다. '데이터 스토리지', '컴퓨팅 파워'이다. 순서대로 빅데이터와 인공지능을 구현하고 활용하는 데 있어 매우 중요한 두 요소라고 볼 수 있다.


데이터 스토리지(Data Storage)는 번역하면 곧 데이터 저장소를 뜻한다. 컴퓨팅 파워란 말 그대로 얼마나 빠르게 복잡한 연산을 수행할 수 있는가에 대한 능력을 의미한다. 결국 클라우드를 이용해 데이터를 바로 저장하고 클라우드상에 있는 컴퓨팅 파워를 빌려올 수 있다. 짐작하겠지만 데이터라는 단어 앞에 '빅'이라는 단어가 붙은 빅데이터는 본래 사이즈가 어마어마하다. 대용량의 빅데이터는 엄청난 저장소를 필요로 한다. 인공지능의 경우 이전 글에서도 말했듯 연산 과정이 매우 복잡하다. 단순히 개인이 가지고 있는 PC에서는 구현이 힘든 경우가 많다. 개개인이 이런 점에서 어려움을 겪을 때 이를 해결할 수 있는 방법이 바로 클라우드다. 


클라우드 컴퓨팅은 기존 빅데이터, AI 구현의 단점 및 불편한 점을 완벽히 보완해줍니다.


데이터 저장소와 컴퓨팅 파워 문제를 클라우딩 컴퓨팅을 통해 해결할 수 있다고 했다. 이 점은 그냥 그렇구나 할 정도로 지나칠 수준이 아니다. 데이터 저장소와 컴퓨팅 파워는 과장을 조금 더하면 빅데이터와 AI 생태계의 가장 큰 약점으로 뽑혔던 요소이기 때문이다. 일반 개인이 빅데이터를 모두 본인의 하드디스크에 저장하고 인공지능 알고리즘을 빠르게 돌릴 만큼의 GPU, 메모리 장치 등을 가지고 있을 확률은 거의 없다. 물론 기업 차원에서도 마찬가지다. 해당 장치들을 구비하는 것은 비용적으로도 큰 문제이지만 그 장치를 누구에게 어디에 비치하느냐도 하나의 골칫거리다.


사실 빅데이터, AI가 좋은 것은 누구나 다 알고 있지만 모든 사람이 빅데이터와 인공지능을 활용하지 못하는 이유가 바로 여기 있다. 아무리 데이터를 긁어모으고 새로 생성한다고 할지라도 이를 실제로 사업에 활용하는 것은 위에 서술한 것 같은 현실적 고려 요소들이 있기 때문이다. 하지만 클라우드가 본격적으로 도입된다면 이야기가 달라진다. 내 하드디스크가 아닌 웹 상에 데이터를 올리고 이를 언제 어디서든 불러올 수 있다. 회사 사무실에 온갖 장치가 다 들어간 비싼 PC가 있을 필요가 없다. 웹에 접속하여 컴퓨팅 파워를 빌려와 이를 이용하면 된다. 어느 정도의 비용만 지불하면 누구에게나 쉽고 간편하게 데이터 및 AI에 접근할 수 있는 환경이 마련되는 것이다.


빅데이터, AI 분야에 클라우드를 이용하는 것은 어느새 이미 보편화되어 있습니다.


이처럼 빅데이터 및 인공지능 분야에 클라우드를 결합하는 것은 엄청난 시너지 효과가 기대된다. 하지만 이는 단지 막연한 기대감이 아니다. 이미 기업에서는 클라우드를 이용해 빅데이터와 인공지능을 운영하기 시작했다. 개인의 영역으로 넘어가면 더 활발하다. 주변을 관찰해보면, 데이터 분석과 인공지능을 위해 클라우드 서비스를 이용하는 사람이 그렇지 않은 사람보다 더 많다. 가장 흔하게 접할 수 있는 구글 드라이브까지 포함하면 클라우드 서비스를 이용하지 않는 사람은 없다고 봐도 무방하다. 아마존과 구글로 대표되는 초대형 기업들이 클라우드 서비스를 제공하기 시작한 지 꽤 됐다. AWS, GCP 등의 단어를 익숙하게 들어본 사람도 많을 것이다.


구글의 예시를 드는 것이 가장 이해하기 쉬울 듯하다. 이미 많은 사람들이 구글 드라이브에 특정 데이터를 올려두기 시작했다. 기본으로 제공되는 용량은 빅데이터를 다루는 사람에게는 조금 작을 수 있더라도 한 달에 몇천 원 수준만 지불하면 더욱 많은 데이터 스토리지를 가용할 수 있다. 그리고 이를 연동해 바로 구글 코랩(Google Colab)을 이용할 수 있다. 구글 코랩은 데이터 분석 및 머신러닝 작업 환경을 제공해주는 클라우드 시스템이다. 일반 개인은 구비하기 힘든 GPU 장치를 제공해준다. 그리고 돈 주고도 못 사는 구글만의 TPU 장치 역시 원한다면 사용 가능하다. 데이터 저장과 인공지능 구현 모두 구글의 클라우드 내에서 가능하다.

구글 코랩과 구글 드라이브 연동 (출처: https://colab.research.google.com/)


기술 간의 상호관계를 이해하는 것,
4차 산업혁명을 꿰뚫는 가장 중요한 요소입니다.


IoT, 자율주행에 이어 이번 시간에는 클라우드가 빅데이터 및 AI 생태계와 어떤 연관성을 끼치고 있는지를 살펴보았다. 4차 산업혁명 기술 요소와 빅데이터/AI를 묶어서 이야기할 때마다 하는 말이 있다. 바로 이 모든 기술들을 독립적으로 바라보는 것이 아니라 상호관계를 이해해야 한다는 것이다. 이 기술들 간의 상호관계가 있는 것은 분명하다. 데이터가 있기에 AI가 존재하고, AI가 있기에 자율주행이 존재한다. IoT를 통해 데이터가 쌓이고 그 데이터를 분석하는 것이 중요한 역량이다. 이런 데이터와 AI를 쉽게 접근할 수 있도록 클라우드가 중요한 역할을 하고 있다.


쉽게 말하면 4차 산업혁명을 이루는 수많은 기술들은 서로 간의 시너지 효과를 내고 있다. 비록 이번 글과 전 글에서는 빅데이터, AI와 IoT, 자율주행, 클라우드 기술을 살펴보았지만 다른 기술들 역시 마찬가지다. 모든 기술들이 서로 연결되어 있다. TV 프로그램을 보면 아이를 기르는 사람이 4차 산업혁명 속에 어떻게 아이를 교육하냐에 대해 많이 고민하고 있다. 4차 산업혁명이라는 것 자체가 두렵다면 4차 산업혁명에 대해 자세히 이해하는 것이 첫 번째이다. 그리고 4차 산업혁명을 이해하는 것은 다시 한번 말하지만 종합적인, 간학문적인 관점이 필요하다. 기술을 이해하는 것이 아니라 생태계를 이해해야 한다.



※ 평소 빅데이터/인공지능에 궁금한 점이 있어 답변을 원하는 내용이 있다면 공유해주시면 감사하겠습니다.

매거진의 이전글 빅데이터 분야 코딩 공부는 기간이 얼마나 필요해?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari