brunch

You can make anything
by writing

C.S.Lewis

by 매일IT IN Apr 09. 2021

당신도 알아야 할 데이터 시각화 의 모든 것

데이터 시각화 자료 모음!

데이터 과학 분야에서 데이터 시각화는 틀림없이 오늘날 최고의 단어입니다. 분석하고자 하는 데이터가 무엇이든 데이터 시각화 는 필수적인 단계인 것 같습니다. 하지만 많은 사람들이 데이터 시각화에 대한 특정 개념을 가지고 있지 않고, 어떻게 구현해야 할지 알지 못합니다. 오늘은 데이터 시각화를 위한 정의, 개념, 구현 프로세스 및 도구를 살펴보겠습니다.


1.데이터 시각화 란?

과학적 시각화, 정보 시각화 및 시각화 분석은 종종 시각화의 세 가지 주요 분기로 여겨집니다. 이 세 가지의 분기를 결합한 새로운 분야인 “데이터 시각화”는 시각 연구 분야의 새로운 출발점입니다.


일반화된 데이터 시각화는 정보 기술, 자연 과학, 통계 분석, 그래픽, 상호작용 및 지리 정보와 같은 다양한 분야를 포함합니다.


1.1 과학적 시각화 Scientific Visualization

과학적 시각화는 과학 분야의 학제적 연구 및 응용 분야이며, 건축, 기상학, 의학 또는 생물학적 시스템과 같은 3차원 현상의 시각화에 초점을 맞추고 있습니다. 과학적 시각화의 목적은 과학자들이 데이터에서 패턴(pattern)을 이해하고, 설명하고, 수집할 수 있도록 과학 데이터를 그래픽으로 설명하는 것입니다.



1.2 정보 시각화 Information visualization

정보 시각화는 인간의 인식을 향상시키기 위해 추상 데이터의 대화형 시각적 표현에 대한 연구입니다. 추상적인 데이터에는 지리적 정보 및 텍스트와 같은 디지털 데이터와 비디지털 데이터가 모두 포함됩니다. 히스토그램, 추세 그래프, 흐름도 및 트리 다이어그램과 같은 그래픽은 모두 정보 시각화에 속하며 이러한 그래픽의 설계는 추상적 개념을 시각 정보로 변환합니다.


1.3 시각적 분석 Visual Analytics

시각적 분석은 과학적 시각화와 정보 시각화의 발전과 함께 진화한 새로운 분야이며, 대화형 시각화 인터페이스를 통한 분석 추론을 강조합니다.

출처: FineReport

2. 왜 데이터 시각화가 필요합니까?


인간은 시력을 통해 얻는 정보양은 다른 기관의 정보보다 훨씬 많습니다. 전세계에서 매일 250경 바리트의 데이터가 생성되며, 전체 데이터의 90%가 지난 2년 동안 생성되었다고 합니다. 지나치게 많은 엑셀 데이터로 인해 이를 관리하고 이해하는 어려움이 계속해서 증가하고 있습니다. 

데이터 시각화는 데이터 처리 및 조직 효율성을 향상시키기 위해 인간의 자연적 기술을 사용하는 것입니다.

시각화를 통해 보다 복잡한 정보를 처리하고 메모리를 향상시킬 수 있습니다.


대부분의 사람들은 통계 데이터(statistical data)에 대해 잘 알지 못하며, 기본적인 통계 방법(평균, 중위수, 범위 등)은 인간의 인지적 성격과 맞지 않습니다. 가장 유명한 예들 중 하나는 안스콤비의 4중주( Anscombe’s quartet)입니다. 통계 방법에 따라 규칙을 보는 것은 어렵지만, 데이터가 시각화되면 규칙은 매우 명확히 보입니다.


3. 데이터 시각화를 달성하는 방법

기술적으로, 데이터 시각화에 대한 가장 간단한 이해는 데이터 공간에서 그래픽 공간으로의 매핑입니다.

전형적인 시각적 구현 절차는 데이터를 처리하고 필터링하여 표현 가능한 시각적 형태로 변환한 다음 사용자가 볼 수 있는 보기로 렌더링하는 것입니다.


시각화 기술 스택

일반적으로 전문 데이터 시각화 엔지니어는 마스터해야 할 기술 스택은 다음과 같습니다.


· 기초수학: 삼각함수, 선형대수, 기하 알고리즘

· 그래픽: 캔버스, SVG, WebGL, 연산 그래픽, 그래프 이론

· 엔지니어링 알고리즘: 기본 알고리즘, 통계 알고리즘, 공통 레이아웃 알고리즘

· 데이터 분석 : 데이터 정리, 통계, 데이터 모델링

· 디자인 미학: 디자인 원리, 미적 판단, 색상, 상호작용, 인지

· 시각화 기반 : 시각 부호화, 시각 분석, 그래픽 상호 작용

· 시각화 솔루션: 차트의 올바른 사용, 공통 비즈니스 시나리오의 시각화


4. 일반적인 데이터 시각화 툴

일반적으로 , R언어, ggplot2 및 파이썬( Python)은 학계에서 자주 사용됩니다. 일반 개인 사용자에게 사장 친숙한 도구는 excel엑셀입니다. 상용 제품으로는 태블로, FineReport, Power Bi등이 있습니다.


4.1 FineReport

FineReport에서  간단한 드래그 앤 드롭만으로 다양한 보고서를 제작 할 수 있고, 데이터 시각화 툴 로서 뿐만 아니라 데이터 의사결정 분석  통합 시스템을 쉽게 구축할 수 있습니다. 

평가: 파인리포트는 각종 데이터베이스와 직접 연동할 수 있으며, 엑셀과 유사한 인터페이스를 기반으로 하고 있습니다. 자체 개발한 19종류의 html5차트 및 50개 이상의 차트 스타일을 기본으로 제공하는 것도 특징입니다. 또한 3D 차트와 동적 차트 효과를 지원합니다. 교차 플랫폼에서 웹 디자인에 적용하고 실시간 업데이트를 지원할 수 있습니다. 현재 파인리포트(FineReport)는 기간과 기능의 제한이 없는 개인 사용자용 라이선스를 공식홈페이지에서 무료로 배포하고 있습니다.

제품 활성화 접속:  FineReport 무료 체험판


4.2 시각화 차트 리이브러리- HighCharts

High Charts는 순수 자바스크립트로 작성된 시각화 차트 라이브러리입니다. 사용자가 웹 애플리케이션에 대화형 차트를 쉽고 편리하게 추가할 수 있다. High Charts는 웹에서 가장 널리 사용되는 차트 도구로, 상업용은 라이선스를 구입해야 합니다.

평가: 사용 임계값이 매우 낮습니다. HighChart는 호환성이 좋으며 성숙하고 널리 사용됩니다. 그러나 스타일이 오래되어 차트를 확장하기가 어렵습니다. 그리고 상업적 이용은 저작권의 구입을 요구합니다.


4.3 Echarts

Echarts는 바이두의 데이터 시각화 팀의 엔터프라이즈급 차트 도구입니다. 순수 자바스크립트 차트 라이브러리로 PC와 모바일 기기에서 원활하게 동작하며, 대부분의 기존 브라우저와 호환이 가능합니다.

평가: 정규 통계 차트를 포함하는 풍부한 차트 유형이 있습니다. 그러나 그래픽 문법에 기초한 Vega 및 다른 차트 라이브러리만큼 유연하지 않으며, 사용자가 복잡한 관계형 차트 지정하기는 어렵습니다.


4.4 Power BI

PowerBI는 조직에서 통찰력을 제공하는 비즈니스 분석 툴입니다. 수백 개의 데이터 소스를 연결하고, 데이터 준비를 단순화하고, 실시간 분석을 제공할 수 있습니다. 기업은 PowerBI에서 생성된 보고서를 웹 및 모바일 장치에서 볼 수 있습니다.

평가: Power BI는 엑셀의 데스크톱 BI 도구(desktop BI tool)와 유사하지만, Excel보다 기능이 더 강력합니다. 여러 데이터 소스를 지원하고 가격이 비싸지 않습니다. 그러나 별도의 BI 도구로만 사용할 수 있으며 기존 시스템과 통합할 수 있는 방법이 없습니다.


마지막으로

데이터 시각화는 다양한 분야를 포함하는 방대한 분야입니다. 시각화 분야가 활력과 기회로 가득 찬 것은 바로 이러한 학제적 특성 때문입니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari