brunch

You can make anything
by writing

C.S.Lewis

by 채규병 Jun 17. 2019

OLAP이란

데이터과학은 새로운가?

나는 신발이 없음을 한탄했는데,

길에서 발이 없는 사람을 만났다.

- 데일 카네기


데이터 과학은 새로운 내용이 아닙니다.

무려 20년 전에 나온 기사를 약간 수정하여 소개합니다.



출처 : 경영과컴퓨터

필자 : 전수경 기자

날짜 : 1999. 06월호




개념 설명

OLAP(On-Line Analytical Processing)은 데이터웨어하우스 활용 수단의 통칭인 BI(Business Intelligence)의 한 분야로 최종 사용자가 정보에 직접 접근해 대화식으로 정보를 분석하고 의사결정에 활용하는 과정을 말한다. 반면, OLTP(On-Line Transaction Processing)는 효율적인 기업 운영을 지원하기 위해 트랜잭션(처리 정보)을 수집하고 분류, 저장, 유지보수, 갱신, 검색하는 기능을 수행하는 실시간 거래 처리 시스템으로 기업의 본연 업무를 지원하는 기간시스템이다. 


현재 항공사의 예약시스템이나 은행의 창구업무시스템 등이 대표적인 OLTP에 해당된다. OLTP시스템으로부터 필요한 데이터를 추출, 수정, 요약해서 의사결정을 지원할 수 있는 데이터베이스를 만든 것이 데이터웨어하우스이고 이에 접근해 데이터를 분석하고 의사결정에 활용하는 방법이 OLAP이다. 따라서 OLAP은 OLTP와 대비되는 개념이라기보다는 OLTP를 활용하는 방법이라 할 수 있다. 



올해 30~40개 DW 사이트 출현

현재 약 70% 이상의 기업들이 DW를 구축했거나 구축을 검토 중에 있다. 이제는 저장된 데이터를 어떻게 활용할 것인가에 기업들의 관심이 옮겨가고 있다. 이미 전 세계적으로 OLAP 시장은 연평균 40% 이상 성장을 계속하고 있다. 지난해 국내 DW 시장은 약 7백억 원, OLAP 시장은 이중 10%에 달하는 70억 원 정도로 추정된다. 올해는 구조조정이 완료된 금융권을 비롯해 보험업계, 정부부처 등이 DW 구축에 대한 구체적인 검토를 진행 중에 있어 약 30~40여 개에 이르는 사이트가 출현할 것으로 예상된다. 


이에 따라 OLAP 시장도 지난해보다 50% 정도 성장한 1백억 원이 예상된다. 오라클, 인포믹스, MS, IBM, 삼성 SDS 등의 대기업들이 일제히 OLAP 부문을 보강하고 있고 OLAP 전문업체를 표방하고 나선 기업들도 속속 등장하고 있다.

 

이에 따라 올 한 해 15여 개의 업체들이 시장 선점을 놓고 치열한 경쟁을 벌일 것으로 예상된다. OLAP은 크게 MOLAP(Multi-dimensional OLAP : 다차원 OLAP)과 ROLAP(Relational OLAP : 관계형 OLAP)으로 구분된다. 이 둘의 가장 큰 차이는 DBMS에 있다. 다차원 데이터베이스(MDB)를 근간으로 하면 MOLAP, 관계형 데이터베이스(RDB)를 근간으로 하면 ROLAP이 된다. 그리고 계층수에 따라 1 tier, 2 tier, 3 tier로 구분되는데, 

DB와 OLAP 툴이 물리적으로 한 하드웨어상에 있으면 1 tier가 되고, DB에 OLAP 툴이 따로 붙게 되면 2 tier, DB와 OLAP 툴 사이에 OLAP 서버가 들어가게 되면 3 tier가 된다. 


최근에는 첨차 3 tier로 가는 추세다. MOLAP은 신속, ROLAP은 대용량 MOLAP은 MDB를 근간으로 분석하는 도구이므로 기존의 RDB에서 MDB로 변환하는 작업이 필요하다. MOLAP 서버의 역할이 바로 이것이다. 

기존의 평면 데이터를 큐브 형태의 다차원 데이터로 변환시켜 미리 저장해 두었다가 원하는 질문이 들어왔을 때 이미 준비된 데이터를 내보내게 된다. 데이터가 정형화되어 있으므로 일정하게 빠른 속도를 보장한다는 것이 MOLAP의 가장 큰 장점이다. 




반면 모든 RDB를 MDB로 전환하는 것은 무리이기 때문에 대부분 일부의 데이터만을 MDB로 구축해 사용하게 된다. 따라서 대용량 데이터 처리가 어렵고, 비 정형화된 질문을 수행하기 힘들다. 부서 단위에서 비교적 소량의 데이터로 신속하고 정교한 분석을 원할 때 MOLAP이 적당하다. ROLAP은 기존의 RDB에 바로 OLAP 도구를 연결해서 사용할 수 있다. 대용량 데이터의 분석이 가능하고 비 정형화된 질문이 가능하다는 장점이 있는 

반면 대용량 데이터로 인해 속도가 떨어지고 다차원 연산 기능이 MOLAP에 비해 떨어진다는 단점이 있다. 

기업 전체 데이터를 분석할 때와 같이 대용량 데이터에 접근할 때 ROLAP이 적당하다. 직접 클라이언트 제품을 연결하여 2 tier 구조로 하기도 하고 그 사이에 서버를 연결해 3 tier로 구성하기도 한다.



MOLAP과 ROLAP의 비교

항목: MOLAP    ROLAP
접근 DB: 다차원 DB    관계형 DB
조회 속도: 일정하게 빠른    속도가변적
데이터량: 대용량 데이터 처리 어려움    대용량 데이터 처리 가능
사용범위: 부서단위에 적합    전사적 단위에 가능
질의 종류: 복잡, 정형화된 다차원 연산    비 정형화된 질문 가능


ROLAP 서버의 역할과 MOLAP 서버의 역할은 다르다. MOLAP 서버가 평면 데이터를 다차원 데이터로 변환하는 작업을 하는 반면 ROLAP 서버는 클라이언트의 부하를 방지하고 신속하게 분석을 처리하기 위해 설치하는 것이다. 클라이언트가 질의만 던져놓고 다른 업무를 보고 있으면 서버가 분석을 마친 후 알려주게 되고 

자주 받는 질의에 대해서 자료를 보유하고 있다가 사용자가 원할 때 바로 알려준다.




대기업-전문업체 각축전

국내에서 MOLAP 제품을 제공하는 업체는 한국오라클, 한국 SAS, 렉스켄, 한국 IBM, 삼성 SDS, HIT, 펜타 컴퓨터, 하이페리온 코리아, 올랩 컨설팅 등이다. 한국오라클은 본사의 MOLAP서버 익스프레스를 제공, 타사의 클라이언트용 MOLAP 제품과 연동해 3 tier로 구성해주고 있다. 추가적 애플리케이션 개발이 가능한 익스프레스 오브젝트가 제품군에 포함돼 있는 것이 특징이다. DB 분야에서 시장을 선점하고 있는 것이 한국오라클에게 가장 큰 강점이다. 현재 한국은행 외환전산망을 비롯, 다수의 공공기관 사이트를 확보하고 있다. 한국 SAS는 본사의 SAS OLAP 솔루션을 제공하고 있다. OLAP보다는 데이터 마이닝 분야에 더 정평이 나있다. 


지난해 가을, 제품이 버전업 되면서 MOLAP의 확장성 제한을 어느 정도 극복, HOLAP의 형태를 갖추게 됐다고 주장한다. 현대자동차 중역 정보시스템, 삼성화재 마케팅 의사결정 지원시스템 프로젝트에 활용됐다. 렉스켄은 코그너스사의 파워플레이를 국내 독점 공급하는 DW 전문업체로 국내 시장에 OLAP 툴을 일찍 소개, 현재 소규모 부서단위를 중심으로 다수의 사이트를 확보하고 있다. 파워플레이는 클라이언트용 툴로서 소규모 DB에 직접 연결해 사용하거나 타사의 서버 제품에 연동해 사용할 수 있다. 렉스켄은 파워플레이 엔터프라이즈 서버가 발표돼 출시를 기다리고 있어 대규모 DB에 대한 접근도 곧 가능해질 것이라고 밝혔다. 대표적인 사이트는 승강기 안전관리원, LG카드, 국민카드 등이 있다.


한국 IBM은 본사의 DB2 OLAP 서버를 제공하고 있다. DB2 OLAP 서버는 에스베이스의 OLAP엔진을 IBM의 관계형 데이터베이스 제품군과 통합한 제품이다. 클라이언트 제품으로는 하이페리온의 클라이언트 제품인 Wired for OLAP을 제공, OLAP에 대한 전체 솔루션을 제공한다. 구축 사이트로는 기아자동차 판매팀, 신동아 화재, 외환은행 등이 있다. 에스베이스는 하이페리온 제품으로 현재 국내에서 삼성 SDS, HIT, 펜타, 하이페리온 코리아, 올랩 컨설팅 등 여러 업체에서 제공한다. 이 제품은 MOLAP 서버 계열로 타사 클라이언트 제품과의 연동이 가능하다. 



국내 주요 OLAP 업체 현황

업체 제품명 제작사 구축 사이트
한국오라클 익스프레스(M) : Server
디스커버리(R) : Client오라클 한국은행 외환전산망, 좋은 사람들 등
삼성 SDS DSS제품군(R) : 전제품군
에스베이스(M) : Server마이크로스트래티지
하이페리온 삼성그룹, SK텔레콤, 한통프리텔 등
렉스켄 파워플레이(M) : Client코그노스 삼성화재, LG화학, 국민카드, 아시아나 항공 등
한국 인포믹스 메타 큐브(R) : 전제품군 인포믹스하나은행, 쌍용화재, 쌍방울 등
한국SAS SAS/OLAP솔루션(M) : 전제품군 SAS현대자동차, 삼성화재, 농촌진흥청, 굿이어 등
한국IBM DB2 OLAP서버(M) : Server
Wired for OLAP(M) : ClientIBM
하이페리온기아자동차 판매팀, 신동아 화재, 외환은행 등
한국MSSQL서버 7.0 OLAP 서비스(H) MSSQL서버 7.0 구축 사이트
올랩컨설팅컴셰어(R) : 전제품군
에스베이스(M) : Server컴셰어
하이페리온한일증권, 제일은행, 해태제과, 포스틸 등
모던정보공학파워 Si(R) : Client모던정보공학태평양생명, 충남대병원 등
한국사이베이스파워디멘전(R) : 전제품군 사이베이스 병원 1~2군데

* M : MOLAP, R : ROLAP, H : HOLAP



모던 정보공학, 자체 툴 공급

국내에 ROLAP 제품을 공급하는 업체로는 삼성 SDS, 한국 인포믹스, 한국 사이베이스, 한국오라클, 올랩 컨설팅, 모던 정보공학 등이 있다.


삼성 SDS는 마이크로스트래티지가 제작한 DSS제품군을 독점 공급하고 있다. DSS제품군에는 DSS서버와 DSS에이전트라는 클라이언트용 제품이 있다. 비즈니스 분석에 의한 메시지를 자동적으로 개인에게 전달할 수 있는 DSS브로드캐스터가 제품군에 포함돼 있다는 것이 차별화된 특징이다. 삼성그룹사를 포함해 SK텔레콤, 한통프리텔 등에 공급했다. 


한국 인포믹스는 95년 말 STG를 인수하면서 ROLAP 제품군인 메타 큐브를 갖추게 됐다. 사용자 단위와 레코드 단위로 이중 보안 기능을 제공한다는 장점이 있다. 하나은행, 쌍용화재, 쌍방울 등의 사이트를 보유하고 있다.


한국 사이베이스는 화이트 라이트사에 50% 출자해 파워 디멘전이라는 클라이언트/서버 제품군을 개발했다. 

의사결정 결과를 시뮬레이션할 수 있고 사용자를 그룹별로 세분화할 수 있다는 특징이 있다. 병원 분야에 1~2군데 구축돼 있다.


한국오라클은 MOLAP 제품인 익스프레스와 함께 ROLAP 제품인 디스커버러도 보유하고 있다. 이것은 클라이언트용 제품으로 RDB에 직접 연결, 사용이 가능하다. 한국은행 외환전산망 프로젝트에 익스프레스와 함께 공급됐다.


올랩 컨설팅은 컴셰어사의 컴셰어 제품군을 국내 독점 공급하는 회사로, 현재 컴셰어 제품군 외에도 에스베이스, TM1등 다양한 솔루션을 보유하고 있다. 


컴셰어 제품군은 한눈에 분석된 데이터를 볼 수 있는 오버뷰 기능과 대량의 데이터 분석에 용이한 Guided Analysis 기능을 강점으로 내세우고 있다. 해태제과, 한일증권, 제일은행 등에 구축됐다.


모던 정보공학은 OLAP 툴 개발 전문업체로 국내 유일하게 자체 개발 OLAP 툴을 제공하고 있는 회사다. 

외산 툴과 비교해 결코 성능이 뒤처지지 않는다고 주장한다. 


그동안 1 tier와 2 tier제품만 제공해 왔으나 이달에 3 tier제품군과 웹 OLAP 제품을 발표할 예정이다. 현재 태평양생명과 충남대병원에 구축 중에 있으며 충남대병원을 시작으로 병원분야를 집중 공략할 계획이다. 




MS 시장 진입에 '경계령' 

MS는 지난해 발표한 SQL 서버 7.0에서 OLAP 서비스를 제공하고 있다. OLAP 서비스 시작 화면에서 MOLAP과 ROLAP 중 하나를 선택할 수 있다. SQL 서버만 구입하면 OLAP 서버를 따로 구입할 필요가 없고 자사의 엑셀이나 타사의 클라이언트용 툴을 연동해 사용이 가능하다. 보유 비용이 저렴하고 설치가 용이하다는 강점이 있다. 

또한 MS는 OLE for OLAP이라는 표준안을 발표, 클라이언트 툴들이 이 표준안을 따를 경우 SQL 서버 7.0의 OLAP 서비스에 연동될 수 있게 했다. 현재 이 표준안을 따르는 업체는 20여 개에 이른다. 


MOLAP과 ROLAP은 지금 시장에서 같이 경쟁하고 있지만 사실 두 제품은 각각 다른 특징을 가지고 있다. 

어느 제품이 더 우수하냐고 묻는 질문에는 답이 없다. OLAP을 원하는 기업의 규모와 용도에 따라 제품을 선택해야 한다는 것이 전문가의 의견이다. 소규모의 부서단위에서 복잡하지만 정형화된 분석을 신속하게 보기를 원할 때는 MOLAP 제품이 용이하고, 기업 전체의 대용량 데이터에 접근해 전체적인 분석을 원할 때는 ROLAP 제품을 권한다는 것이다.




시장 주도권 올해가 분수령

전 세계적인 OLAP 시장 점유율을 보면 에스베이스의 하이페리온이 1위를 차지했고, 익스프레스의 오라클과 파워플레이의 코그노스가 각각 2,3위에 위치해 먼저 출발한 MOLAP 업체들이 상위를 선점했다. 그 뒤로 DSS제품군의 마이크로스트래티지가 4위를, 컴셰어 제품군의 켬셰어사가 5위를 차지했다.


전 세계 주요 OLAP 업체 시장점유율(단위 : %)

업체 제품명 순위 점유율
하이페리온 에스베이스 1 28.7
오라클 익스프레스, 디스커버리 2 17.0
코그노스 파워플레이 3 9.6
마이크로스테레티지 DSS제품군 4 6.4
컴셰어컴셰어 제품군 5 4.8
지즈니스오브젝트 지즈니스오브젝트 6 4.4
시게이트소프트웨어 홀로스7 3.6
SAS OLAP솔루션 8 3.6
인포메이션 어드밴티지IQ/Vision 9 2.9
애플릭스TM1 10 2.5

<자료 : The OLAP Report>


지난해 국내 시장 점유율도 이와 유사한 형태였다. MOLAP 분야에서는 익스프레스와 에스베이스가 서버 부문에서 시장의 상위를 차지했고, 클라이언트 제품으로는 파워플레이가 소규모 부서 단위에서 다수의 사이트를 확보했다. ROLAP에서는 DSS제품군이 가장 점유율이 높은 것으로 알려지고 있다. 그러나 지난해 국내 시장은 IMF로 인해 대부분의 프로젝트가 연기되는 바람에 시장규모가 예상에 크게 못 미쳤다. 대부분의 업체에서 올해가 지나야 국내 OLAP 시장의 판세가 판가름날 것으로 예측한다. 올해 시장 점유율에 대해서 관련 업체는 'DBMS의 시장 구도대로 간다. MS가 SQL 서버 7.0에서 OLAP 서비스를 제공함으로써 시장의 판도는 확 바뀐다. 전문업체들의 약진을 두고 봐야 한다' 등 의견이 분분하다.


초기 시장 선점을 위해 일단 저가경쟁은 피할 수 없게 됐다. 특히 MS가 SQL 서버 7.0의 한 컴포넌트로 OLAP 서비스를 제공, 거의 무료로 OLAP 서버를 제공하는 정책을 폄으로써 OLAP 툴의 가격은 크게 떨어질 것으로 예상된다. 또한 MS의 SQL 서버 7.0의 점유율에 따라 몇몇 업체에서는 클라이언트 툴에 집중해 MS와 협력할 계획이라고 밝혔다. 일부에선 전체 솔루션을 제공하는 형태보다는 여러 회사가 협력하여 전체 프로젝트에 적합한 부분 툴을 제공하는 형태로 갈 것이라고 전망한다. 업계가 서로 연동 가능한 오픈 아키텍처를 지향함에 따라 표준안 문제가 불거져 나오고 있다. 


표준안이란 서로 연동 가능한 OLAP 개발 규약으로 표준안을 따르게 되면 자유롭게 다른 DB나 서버에 연결할 수가 있다. MS는 RDB 액세스 표준안으로 ODBC 드라이버를 발표한 이후 MDB 액세스 표준안으로 OLE DB for OLAP을 발표했다. 현재 20여 개 업체가 이 표준안에 가입했다. 또한 오라클을 포함, 코그노스, IBM 등이 가입해 있는 OLAP 벤더들의 비영리 단체인 OLAP 카운실에서도 MDAPI 2.0이라는 표준안을 내놓고 있다. 어느 쪽이 업계의 표준안이 될지는 지켜봐야 하겠지만 현재는 MS 쪽으로 조심스럽게 손을 들어주는 분위기다.



웹 OLAP으로 빠른 이동

MOLAP과 ROLAP의 시장 선점 경쟁이 계속되는 가운데 각각의 장점을 살린 HOLAP(Hybrid OLAP)이 대두되고 있다. 벌써 자사의 제품이 HOLAP 제품이라고 주장하는 업체들도 있지만 아직은 자사 OLAP의 단점을 보완하는 수준에 머무르고 있는 실정이다. HOLAP은 명실상부하게 두 종류의 OLAP을 결합한 형태로서 

정형화된 소규모 MDB에서 신속하게 분석을 하다가 MDB에 없는 데이터를 원할 경우 RDB로 직접 질문을 던질 수 있는 형태를 말한다. 


MS의 OLAP 서비스의 경우 HOLAP을 표명하고 있지만 이러한 형태와는 다른 것으로, 작업 시작 전에 MOLAP과 ROLAP 중에서 하나를 화면상에서 선택하게끔 돼 있다. 최근 모든 업체가 앞다퉈 웹 OLAP을 내놓고 있다. 그동안 클라이언트 형태나 클라이언트 서버 (C/S) 형태에 머무르던 OLAP 시장이 급속히 웹 기반으로 전환되고 있다. 웹 OLAP은 별도의 클라이언트 SW가 필요 없고 범용 브라우저만 있으면 기업 내 데이터를 자신의 클라이언트로 끌어와 분석할 수 있다. 클라이언트 부분의 별도 SW 설치비가 안 들어가기 때문에 가격이 저렴하고 이동 사용자가 외부에서도 회사의 데이터에 접속할 수 있다는 장점으로 인해 사용자들의 인기를 모으고 있다.


그러나 웹 OLAP이 아직 C/S OLAP에 비해 기능이 떨어지는 것으로 알려져 얼마나 C/S OLAP과 동일한 기능을 갖추느냐가 웹 OLAP 시장을 선점하는 관건이 될 것으로 보인다. ERP와 같이 기존에 구축돼 있는 OLTP성 데이터에 바로 OLAP을 연결하려는 움직임도 있다. OLAP의 이용 분야가 DW에서 점점 확대되고 있는 것이다. 대용량의 데이터라면 형태에 관계없이 OLAP을 연결해 활용하려는 시도가 계속될 전망이다.






작가의 이전글 [번역] 맵리듀스(MapReduce) - 1
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari