데이터 분석 초심자들을 위한 용어 정리
안녕하세요, 하트카운트팀입니다.
이 글은 데이터와 친해지고 싶은 보통 사람들이 알아두면 좋을 데이터 분석 관련 지식을 기초부터 쉽게 알려드리기 위해 기록하였습니다.
쌩기초자도 'IT잘알'이 될 수 있도록, 개발자들과 마음껏 소통할 수 있도록.
다음에는 다른 주제로 관련 용어 정리 및 최근 동향 분석까지 포스팅할 예정이니 기대해주세요.
과거 1980년대 전후하여 원격지에 있는 컴퓨터와 근처에 있는 단말기 사이에 있는 수 많은 통신장비 및 네트워크를 다 그리지 않고 구름 모양을 그려서 설명을 하였다. 이후 2000년대에 클라우드 컴퓨팅이 등장하면서 이 개념을 설명하기가 애매하여 이 구름 개념을 따 와서 구름(cloud)이라고 한 것이 클라우드다.
즉, 클라우드의 의미는 컴퓨터 통신망이 복잡한 네트워크 및 서버 구성 등을 알 필요 없이 구름과 같이 내부가 보이지 않고, 일반 사용자는 이 복잡한 내부를 굳이 알 필요도 없이 어디에서나 구름 속의 컴퓨터 자원으로 자기가 원하는 작업을 할 수 있다는 것이다. 이른바 동일한 체험을, 인터넷이 연결된 어디에서나 보장해주는 것이다.
2019년 조사에 따르면 800개 기업 중 94%가 클라우드 컴퓨팅을 사용하고 있었으며, 2021년까지 전체 클라우드 인프라를 사용하는 기업은 절반 이상이 될 전망이다.
대표 서비스: Amazon Web Services (AWS), Microsoft Azure, Google Cloud Platform
(각 서비스의 주요 특징 또한 아래에서 설명할 예정.)
*. 온프레미스 (On-Premise)
소프트웨어 등 솔루션을 클라우드 같이 원격 환경이 아닌 자체적으로 보유한 전산실 서버에 직접 설치해 운영하는 방식. 퍼블릭 클라우드와는 반대되는 개념으로 이해하면 된다.
B-1 장점
- 인터넷 서비스 운영자의 경우 직접 서버를 운영하는 대신에 대기업의 클라우드 서비스를 빌려 쓸 수 있기 때문에 차후에 서비스의 규모가 커졌을 때 대처하기 편하다.
- 서버 세팅/확장 등은 신경쓰지 않고 서비스 운영 자체(핵심 업무)에 집중할 수 있다.
- 최근의 시국처럼 원격근무가 필요할 때 용이하다.
- 저렴한 초기 투자 비용 / IT 투자비용(CAPEX)을 절감한다 / 예측 가능한 비용 산정
B-2 단점
- 데이터 증가에 따른 추가적인 비용 상승 가능성/데이터 이동시에 발생하는 과도환 비용
- 관리소홀로 인해 하루아침에 데이터가 통째로 증발될 수 있다. (대참사)
- 보안 이슈; 부주의 및 내부 침입 등으로 인해 전혀 상관없는 제3자에게 공개될 수 있다.
( ex. 클라우드 회사의 하청을 맡아서 서버 일부를 관리하고 있던 회사에서 데이터를 빼돌린다던지, 어디선가 망한 회사의 클라우드 서버를 사들여서 저장돼있는 데이터를 개인목적으로 사용한다던지)
> 클라우드의 선택기준이 회사의 신용도여야 하는 이유이다.
클라우드 컴퓨팅 서비스는 사용자가 클라우드 서비스 제공 업체로부터 얼마만큼의 자원을 제공받고, 얼마만큼의 자원을 직접 관리하는가에 따라 3가지 모델로 나뉜다.
서버, 스토리지, 네트워크 장치, 애플리케이션 등 클라우드 환경에 필요한 대부분의 리소스, 인프라스트럭쳐 부분을 제공하는 모델. 사용자는 사용량 만큼 비용을 지불한다. IaaS 서비스 업체는 사용자를 대신해 온프레미스 데이터센터를 유지/관리하고, 사용자는 운영체제, 애플리케이션 등을 직접 관리해야 한다. 인프라 구축 비용이 절감되어 초기 투자 비용이 낮다는 점에서 자체적인 인프라 구축에 부담을 느끼는 중소기업과 클라우드 활용도가 높은 대기업에게 매력적이다. 단, 외부에 데이터를 저장하기 때문에 보안에 있어서 주의가 필요하다.
ex. AWS의 E2C(Amazon Elastic Compute Cloud)
말 그대로 서비스 개발, 애플리케이션 배포 등을 실행하는데 필요한 플랫폼을 제공하는 모델. PaaS 서비스 업체는 인프라, 운영 체제 및 소프트웨어 개발을 위해 필요한 기능들을 API 형태로 제공하여 관리하며, 서비스를 사용하는 동안 해당 애플리케이션에 대한 설치와 관리는 사용자가 해야 한다. 보통 개발자와 프로그래머들은 인프라 또는 플랫폼을 구축할 필요 없이 서비스 개발에만 집중할 수 있기 때문에 유용한 서비스이다. 다만, 이미 한 플랫폼에서 애플리케이션을 개발한 경우 다른 플랫폼으로의 이동(마이그레이션)이 어려울 수 있다.
ex. Google App Engine, IBM Bluemix
*) API (Application Programming Interface)
Application: 응용 프로그램, 앱
Interface: 사용자가 물건을 조작하기 위한 디자인. ex. 두번 탭하기/ 화면 확대하기 등
Programming Interface: 사람이 아닌 한 프로그램이 다른 프로그램을 이용하기 위한 디자인. 기계가 이해하기 쉽게 입출력이 데이터로 이루어 짐.
; 쉽게 말해, 프로그램과 프로그램이 데이터를 서로 전달할 수 있도록 도와주는 '매개체'
- 애플리케이션과 기기가 원활하게 커뮤니케이션할 수 있도록 돕는 역할
- 기계/운영체제 등과 상관없이 누구나 동일한 액세스를 얻을 수 있도록 하여 모든 접속을 표준화하는 역할
- 서버 및 데이터베이스의 정보 보안을 위해 허용된 사람들에게만 접근성을 부여하는 역할
- API의 유형
1) private API
회사 개발자가 자체적으로 / 내부적으로 발행. 제 3자에게 노출되지 않음.
2) public API
개방형 API, 모두에게 공개됨.
3) partner API
기업이 허용한 특정인들만 사용할 수 있음. 비즈니스 관계사/파트너 회사 간에 사용
클라우드 환경에서 운영되는 소프트웨어나 애플리케이션을 사용자에 제공하고, 사용자는 소프트웨어를 구입해 따로 설치할 필요 없이 네트워크를 통해 필요한 만큼만 빌려 쓰는 서비스 모델이다. 인프라 구축, 업데이트, 유지보수 등 모든 관리는 SaaS 업체가 하며 사용자는 필요한 기능을 고려하여 특정 요금제를 선택, 구독 형태로 이용할 수 있다. 집을 예시로 들자면, 모든 것이 빌트인되어 있는 집에 월세만 내고 사는 것. 우리에게 가장 익숙한 유형이다. 태블릿, 스마트폰으로도 네트워크만 연결된다면 이용할 수 있다. 대부분 구독형 서비스이기 때문에 경제적이고 유연하다는 장점이 있으며 별다른 IT 관리자가 없더라도 계정 로그인이나 API를 심어서 쉽게 사용이 가능하다는 점에서 이제 막 비즈니스를 시작하는 스타트업들에게는 필수적 존재가 되었다.
ex. Google Cloud, Naver Cloud, Heartcount, Slack, Notion, Stibee 등
내용 참고 :
https://www.redhat.com/ko/topics/cloud-computing/iaas-vs-paas-vs-saas
AWS는 2006년 출시된 최초의 클라우드이자 현재까지 점유율 1위(21년 4월을 기준으로 32% 점유)를 자랑하고 있는 (클라우드 인프라 시장의 절반을 차지한다.) 아마존의 자회사이다. 아마존은 B2C 영역으로는 '킨들', B2B 영역으로는 'AWS'로 IT/Tech에 투자하였다. 킨들은 e북 시장을 개척했고 AWS는 200클라우드 대중화에 성공했다. 특히 AWS는 비개발자에게도 익숙한 이름일텐데, 2012년 한국지사를 설립하고 활발히 비즈니스 활동을 이어오고 있다.
위에서도 설명했듯이 AWS는 인프라를 제공하는 IaaS 이다. 다른 클라우드 서비스도 마찬가지이지만, AWS는 대량의 서버, 스토리지, 네트워크 장비를 구매해놓고 사용자들에게 인프라를 대여해주기 때문에 초기 비용이 부담스럽거나 이벤트 혹은 출시 기간에 많은 사용자가 몰리는 경우(아마존 또한 기존 서버 사용량과 블랙프라이데이와 같은 행사 때의 서버 사용량이 80% 이상 차이가 나자 남는 유휴 서버를 활용해보고자 클라우드 사업을 시작했다고 한다.)에 유용하다. 또한, 세계 각 국에 인프라를 구축해놓기 때문에 해외 진출을 노리는 업체에게 적합하다. 사용자는 각 장비를 사용한 만큼만 비용을 지불하면 된다.
AWS는 사업 초기 주로 중소 기술기업에 클라우드 스토리지와 컴퓨팅 서비스를 제공하였는데, 사업이 확대되면서 많은 기업들이 아예 아마존에 컴퓨팅 자원을 의존하게 되었다. 특히 AWS의 CEO 앤디 재시는 신생 스타트업부터 세계 최대 기업인 애플, 중앙정보국(CIA) 등을 다양한 기업을 고객으로 유치하는 역량을 보여주었다. 또한, 넷플릭스, 삼성, SK, 핀터레스트, 슬랙 등 기업들이 AWS 시스템을 이용하고 있다.
Azure는 Microsoft의 Azure은 플랫폼 및 인프라를 제공하는 서비스이다. 전세계 클라우드 시장 2위로(21년 4월 기준으로 19% 점유) AWS에 못 미칠 뿐이지 MS의 매출과 주가를 견인하고 있다. 또한, IaaS에 강한 AWS와 달리 SaaS에 강하다. Azure는 해킹 방어 방법으로 무한정으로 서버를 생성하는데, 공격하는 IP를 찾아 밴시켜버린다. 또한, 아마존에 비해서 MS가 소프트웨어 개발 회사이기 때문에 MS인프라, 즉 자사 서비스간의 연동 및 설정이 편리하다는 이점이 있다. 또한, AI 머신러닝에 특화되어 있어 자연어를 넣어도 AI가 코딩을 해주기 때문에 생산성 향상이 엄청나다는 장점이 있다. 실제로 어도비, HP 등 세계적인 기업들도 Azure을 사용한다. 이와 동시에 Azure과 구글 클라우드는 각 업체에 의존적인 형태의 서비스가 다수이기 때문에 학습이 더 필요한 경우가 많다. 결론적으로 사람에 따라 편하다고 느낄 수도 진입장벽이 높다고 느껴질 수도 있다. Azure는 사용시간별로 비용을 지불하는 시스템인데, 가격 면에서는 AWS보다 저렴한 편이다( 여기서 함정인 부분은 AWS는 기본 가격은 비싸지만 무료 옵션이 많이 포함되어 있고 Azure는 기본 제공 옵션이 적어 추가 비용이 많이 드는 편.. ) 번외로 Azure의 뜻은 '창공의 색'이다.
구글에서 개발한 클라우드 컴퓨팅 플랫폼이다. 현재 10% 미만의 점유율(21.4월 기준)로 아마존, 마이크로소프트와 함께 클라우드 시장의 3위의 위치를 공고히 지키고 있다. 재밌는 점은 닌텐도의 포켓몬GO도 구글 클라우드 플랫폼을 기반으로 하고 있다. 안드로이드 OS와 검색 엔진을 서비스한다는 점에서 높은 접근성을 장점으로 모바일 시장을 확대하는 등 가파른 성장세를 보이고 있다. 구글 클라우드의 가격 정책을 누군가는 혁명이라고 칭하였는데, 그 이유는 구글 클라우드 플랫폼을 오래 사용할 수록 사용 가격이 줄어드는 제도 때문이다. 예를 들어, 한 달의 25% 이상 클라우드를 사용한다면, 컴퓨트 엔진(구글 클라우드 플랫폼의 IaaS 구성요소로서, 구글의 검색 엔진, G메일, 유튜브 등 서비스를 구동하는 인프라스트럭처 위에 빌드된다.)이 자동적으로 이를 비례적으로 계산하여 할인을 제공한다. 또한, 시간으로 올림 과금되는 타 클라우드와 달리 10분 이후로는 분단위로 과금이 된다는 특징이 있다.
[ 앤디 제시, 아마존 CEO 취임 ]
AWS의 움직임이 가장 주목할만 하다. AWS의 수장 앤디 재시가 창립 27주년 기념일인 2021년 7월 5일부터 아마존의 CEO로 공식 취임할 예정이다. 아마존의 2020년 4분기의 영업이익에 52%나 기여하며 아마존 리테일을 꺾고 핵심사업으로 자리매김하고 있는 AWS의 사업 실적이 큰 부분을 기여한 것으로 보인다.
[ 클라우드 기업들의 스페이스 전쟁 ]
일론 머스크의 스페이스X로 우주에 초고속 위성 인터넷망을 구축하는 것처럼, AWS도 지난 2020년 7월 항공 우주 프로젝트를 위한 부서를 설립했다고 밝혔다. AWS는 앞서 소형 위성 3236개를 우주에 쏘아올려 전 세계에 '초고속' 인터넷을 제공하는 카이퍼프로젝트를 공개한 적이 있는데, 마찬가지로 바다 위에서도 인터넷이 가능하도록 만드는 것이 목표이다. 아마존은 창업자 제프 베조스가 구축하고 있는 우주인터넷 '카이퍼'를 중심으로 클라우드 컴퓨팅 기반 지상국과 위성 데이터의 처리, 분석, 저장과 같은 본연의 서비스를 고도화하는데 집중하고 있다.
한편, 2021년 5월 13일 구글 클라우드와 스페이스X가 계약을 체결하였다. 이번 계약에 따라 스페이스 X는 전 세계 구글 클라우드 데이터센터에 스타링크(스페이스x의 위성 인터넷 서비스) 지상국을 설치할 예정이다. 이에 따라 스타링크 고객들은 구글 클라우드 서비스를 제공받을 수 있게 되었다. 구글은 다양한 기업 클라우드 고객이 위성 네트워크를 이용할 수 있게 할 계획이다. 구글은 이번 스페이스X와의 계약으로 아마존의 경쟁에서 승리한거나 마찬가지라고 평가했다. 스페이스는 현재 우주 공간에 1550여 개의 위성을 띄웠으며 지난해부터 시작된 스타링크 시험 서비스는 북미와 유럽 일부 국가에서 1만 명 이상의 이용자를 보유 중이다. 구글의 목표는 2021년 말까지 스타링크(스페이스X의 우주 인터넷)를 통해 지구 어디에서나 구글 클라우드에 접속이 가능하도록 하는 것이라고 한다. 사실 이 두 회사의 관계는 6년 전 시작되는데, 구글은 2015년 스페이스 x에 10억 달러를 투자하고 지분 10%를 확보했다. 또한 구글의 글로벌 파트너십 담당 사장인 돈 해리스는 현재 스페이스 X 이사회의 구성원이다.
그럼 마이크로소프트는 뭘 하고 있을까? MS Azure 역시 작년 우주 기반 클라우드 컴퓨팅 비즈니스를 전담할 자회사를 설립했고 관련 인재들을 공격적으로 영입하고 있다. MS는 작년 10월 스페이스X와 전략적 파트너십을 체결하였고 자사의 이동식 데이터센터인 '애저 모듈러 데이터센터'를 스타링크를 통해 접속할 수 있도록 했다. 또한, 자체 위성통신 인프라가 없기 때문에 사업 초반부터 다수의 위성통신 사업자들과 파트너십을 확대하고 있다.
관련 기사 : http://dongascience.donga.com/news.php?idx=47046
실무자를 위한 데이터 자동 분석 솔루션, 하트카운트 사용해보기
여기를 클릭해주세요.
하트카운트 뉴스레터 구독하기는 여기를 클릭해주세요.
하트카운트 도입, 견적 및 구축 문의는 여기를 클릭해주세요.
(협업 문의는 support@idk2.co.kr로 부탁드립니다.)
하트카운트 데모 비디오는 여기를 클릭해주세요.
여기를 클릭하여 데이터 분석/시각화 커뮤니티 '데이터 히어로'에 참여하세요.