brunch

You can make anything
by writing

C.S.Lewis

by 삼더하기일 Mar 28. 2021

빅데이터/AI 공부하려면 좋은 컴퓨터 필요해?

빅데이터와 컴퓨팅 파워

빅데이터와 인공지능 업계에 종사하는 사람을 생각하면 떠오르는 이미지가 하나 있다. 아마 대다수의 사람들은 컴퓨터 앞에서 코딩을 하며 무언가 열중하는 사람의 이미지를 떠올릴 것이다. 이 지점에서 이제 막 빅데이터나 인공지능을 공부하는 사람들에게 고민거리가 하나 생길 수 있다. 이 업계에 종사하는 사람들은 다 성능이 좋은 개인 컴퓨터를 가지고 있는 듯한데 본인은 그렇지 못하다는 것이다. 관련해서 이 분야 공부를 위해서 어느 정도의 성능을 가진 컴퓨터가 필요한지 궁금증을 가지고 있는 사람이 꽤 있다.


빅데이터/AI 공부하려면 성능 좋은 컴퓨터 구비해야 하나요?


사실 일반적인 한 개인을 떠올려보면 그렇게까지 좋은 성능의 개인 PC를 보유하고 있는 경우는 많지 않다. 많은 사람들이 가벼운 문서 작업 용도로 노트북을 구비하는 경우가 많으며 그렇기에 노트북의 성능보다는 가벼운 노트북을 찾게 된다. 그리고 하나 말하자면 확실히 빅데이터와 인공지능을 제대로 구현하기 위해서는 좋은 성능의 컴퓨터가 필요하기는 하다. 분석 대상이 되는 데이터의 용량이 커질수록 더욱 그러하고 구현하고자 하는 인공지능이 딥러닝 기술을 이용해야 하는 경우에 특히 그러하다.


데이터 분석을 배우지 않은 사람들이 데이터를 열 때 이용하는 대표적인 프로그램으로 엑셀을 들 수 있다. 하지만 진짜 대용량 데이터는 아예 엑셀로 열리지 않는다. 엑셀로 열 수 있는 데이터의 개수 자체가 제한이 있다. 최대 범위 안의 데이터라 할지라도 데이터가 수십만 개 수준이 되면 데이터 파일을 열 때부터 컴퓨터가 굉장히 버벅거리기 시작한다. 하지만 컴퓨터 문제를 겪는 사람이 비단 나 하나뿐일까. 이미 같은 고민을 겪고 있는 사람이 많기에 이미 세상은 개인이 좋은 PC를 굳이 소유하지 않아도 되도록 변화하고 있다. 따라서 본인이 고성능의 컴퓨터를 가지고 있지 못하다고 하더라도 실망할 필요는 없다.


네 좋은 컴퓨터 필요합니다. 근데 그 컴퓨터를 내 돈 주고 사서 가지고 있을 필요는 없습니다.


사실 빅데이터/AI를 공부하고자 하는 사람들이 어느 정도의 성능을 가진 컴퓨터를 구비해야 할까 생각해보았을 때, 딱 한마디로 정의를 내리기는 쉽지 않다. 개인마다 상황이 다르기 때문이다. 하지만 거의 대부분의 경우에는 아예 성능이 좋은 컴퓨터를 굳이 가지고 있지 않아도 되거나 나의 컴퓨터로 분석을 돌리지 않아도 된다. 이 말은 즉, 빅데이터/AI를 공부하고자 하는 사람이라도 굳이 무리해가며 비싸고 성능 좋은 컴퓨터를 따로 구매하지 않아도 된다는 의미이다. 가장 흔한 경우들의 이야기를 하며 왜 좋은 컴퓨터를 굳이 가지고 있지 않아도 되는지 말을 해보도록 하겠다.



1. 처음 공부를 할 때는 높은 수준의 컴퓨팅 파워가 요구되는 경우가 아예 없어요.


가장 먼저 생각할 경우는 이제 막 빅데이터와 인공지능을 공부하는 입문자 케이스다. 사실 입문자 케이스에서 성능 좋은 컴퓨터를 가지고 있을 필요가 없는 이유는 간단하다. 그 정도 수준에서는 진짜 대량의 데이터, 정말 복잡한 구조의 딥러닝 알고리즘을 돌릴 일이 아예 없다. 우선, 공부를 위해 사용되는 데이터부터 그렇게 큰 용량을 차지하지 않는다. 실제 현업에서나 연구를 위해 빅데이터를 돌릴 때는 정말 상상 이상으로 큰 데이터를 접하게 될 때가 많다. 하지만 입문자에게 그런 데이터를 분석하라고 요구하지는 않는다. 그리고 처음 공부를 하는 사람에게 진짜 대용량의 데이터를 돌려보라고 강요할 이유도 전혀 없다.


그렇기에 입문용 데이터셋을 천천히 살펴보면 모든 데이터가 엑셀로도 충분히 열리는 수준의 크지 않은 데이터이다. 그리고 데이터셋의 크기가 작기 때문에 그 데이터로 무엇을 돌리든 그렇게 컴퓨터가 부담스러워하지 않는다. 많은 연산량이 요구되는 머신러닝, 딥러닝 알고리즘을 돌릴 때에도 데이터의 숫자가 확연히 작으면 우리가 일반적으로 소유한 PC로도 충분히 연산이 가능하다. 하나만 더 추가하자면, 정말 복잡하기로 소문난 알고리즘들의 경우에는 입문자들이 접하게 될 강의나 책에서는 아예 등장하지 않을 가능성이 높다.



2. 개인 PC가 아니라 회사나 학교의 서버 컴퓨터 등을 이용하면 됩니다.


다음으로 생각해 볼 경우는 대학원에서 연구를 위해 빅데이터/AI를 구현하거나 기업에 속해서 데이터 분석 업무를 하게 되는 경우이다. 이 케이스에 해당하는 경우 역시 본인이 직접 고성능의 PC를 소유할 필요가 없다. 웬만한 경우에는 학교나 회사에서 컴퓨터를 지원하는 경우가 많기 때문이다. 그게 서버 컴퓨터라는 이름으로 불리든 특정 클라우드를 이용하는 형식이든 말이다. 그리고 많은 경우에 개인 PC에서 해당 고성능 PC로의 연결을 쉽게 만들어 둔다. 그냥 내 컴퓨터를 열어서 성능 좋은 PC에 접속하여 거기서 분석을 진행하면 된다.


회사나 학교들도 바보가 아닌 이상 대용량의 데이터를 분석하거나 연산량이 많은 인공지능을 구현하고자 할 때 이걸 개인 PC로 이용하라고 하지는 않는다. 업무를 위해 고성능의 PC를 구매하라고 강요했을 때 터져 나오는 불만을 감당할 수 있는 곳이 있을까. 그리고 만약 업무용으로 데이터를 분석해야 하는 일이 있다면, 보안 문제 때문이라도 어쩔 수 없이 개인 PC는 이용하지 못할 가능성이 높다. 내 개인 PC에 업무를 위해 필요한 데이터를 저장하는 것 자체가 매우 위험한 행동이 될 수 있다.



3. 이도 저도 아닐 경우 클라우드 기반 서비스를 이용하면 됩니다.


마지막으로 이야기할 케이스는 입문 수준을 넘어 이제 진짜 어느 정도의 컴퓨팅 파워가 필요한 작업을 해보려고 하지만 이를 회사 컴퓨터나 학교 컴퓨터로는 이용하기에 한계가 있는 경우이다. 데이터 분석 분야의 경우 공모전이 많이 개최되고 있는데 그러한 공모전을 참가하려는 경우가 이 사례에 해당한다. 하지만 이 경우에도 걱정할 필요는 없다. 세상이 많이 발전했기에 이제 클라우드라는 이름으로 데이터 분석을 진행할 수 있도록 셋팅이 되어있는 것이 많기 때문이다.


그중 가장 유명하면서도 많이 이용되는 서비스가 구글의 Colab이다. 보통 코랩이라고 부르며 구글에서 제공하는 데이터 분석 환경에 접속하여 데이터를 업로드하고 분석할 수 있도록 한다. 데이터 분석을 공부하고 해당 업계에 있는 사람이 굉장히 많이 이용하고 있는 서비스이다. 기본적으로 무료로 운영이 된다는 것이 상당한 메리트이다. 빅데이터/AI 쪽에 더 욕심이 생겨 코랩 프로라고 불리는 서비스를 신청하게 될 경우에만 이용료를 내면 된다. 게다가 코랩 프로 역시 한 달에 약 10달러 수준으로 그렇게까지 부담스러운 가격은 아니다. 아마 코랩 프로 정도의 성능만 가지고 있더라도 개인적으로 어떤 분석을 수행하기에 부족함을 느끼지는 않을 것이다.


빅데이터/AI는 많은 관심을 받고 있기에 분석 환경 역시 점차 좋아지고 있습니다.


오늘 이야기했던 빅데이터/AI 분석을 위해 고성능의 컴퓨터 구비를 고민하는 사람들이 대부분 모르고 있는 것이 하나 있다. 바로 내가 모든 데이터를 구하고 분석하고 또 데이터를 분석하는 환경까지 스스로 셋팅해야 할 필요가 없다는 점이다. 빅데이터/AI는 꽤 예전부터 많은 관심을 받고 있고 그 수요가 높아지고 있다. 따라서 분석 환경 역시 점차 발전하고 있는 것이 사실이다. 결국, 내가 모든 것을 스스로 준비하고 구비해야 한다는 생각을 가질 필요가 없다. 세상의 발전에 감사해하며 부담 없이 빅데이터/AI 공부를 진행하면 그것으로 충분하다.



※ 평소 빅데이터/인공지능에 궁금한 점이 있어 답변을 원하는 내용이 있다면 공유해주시면 감사하겠습니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari