brunch

You can make anything
by writing

C.S.Lewis

by GTPlus Aug 19. 2021

건강보험 대상자 바 히스토그램 차트 그리기

Qlik 막대 차트를 이용한 바 히스토그램 차트



안녕하세요 

GTPlus 김대리입니다. 클릭(Qlik) 튜토리얼 다섯 번째 시간입니다. 


대시보드를 만들 때 막대그래프(bar chart), 면적그래프(area chart), 산점도(scatter plot), 선 그래프(line chart), 원그래프(pie chart), 버블 그래프(bubble chart), 방사형 그래프(rader chart)... 등 다양한 그래프 중 데이터의 인사이트를 발견할 수 있는 적합한 차트를 선택하는 것이 중요합니다. 


오늘은 클릭의 기본 막대차트를 응용해서 바 히스토그램 차트를 만드는 방법을 소개하겠습니다. 

히스토그램 범주 집합에 대한 변수의 분포 및 관계를 표시하는 것으로 막대그래프의 변형입니다. 

예를 들어 20~30세, 50~60세처럼 연속된 데이터를 시각화할 때 사용됩니다.




실습 예제로 마스터하기

<남녀 연령별 건강보험 적용 인구 시각화하기>


남녀 연령별 건강보험 적용 인구를 실습 예제로 준비해보았습니다. 바 히스토그램 차트의 좌우 방향은 각각의 성별 집단을 의미하고 막대의 길이는 연령 별 인구수를 나타내고 있어 두 집단의 쉽게 비교 가능합니다.


1. 데이터 로드하기 


- 시도, 성별, 연령별 건강보험 적용인구수 데이터가 있는 엑셀 파일을 준비합니다. 


- 엑셀 파일의 'People'워크시트를 선택하고 ‘다음’ 버튼을 클릭하고 데이터를 LOAD하여 시트 편집 모드로 이동하면 모든 준비과정이 완료됩니다.




2. 차트 생성



먼저 속성 패널에 있는 차트 메뉴에서 막대형 차트를 생성합니다. 


만들고자 하는 차트는 남녀 나이 별 건강보험 적용인구수이므로, 

차원에는 ‘연령’, 측정값에는 ‘건강보험적용인구수’의 합을 입력합니다.


현재 차트는 남녀 구분 없이 총인구수가 표현되고 있습니다.

남성, 여성에 해당하는 인구수의 총합만 표현하기 위해 측정값을 수정합니다.




3. 남녀 별 해당하는 인구수 나타내기

각 성별에 따른 인구수의 총합을 표현하기 위해 측정값에 조건을 추가하는 단계입니다.


1) 남녀를 구분하기 위해 첫 번째 입력한 인구수 총합 측정값을 복제합니다


측정값에 총두 개의 인구수 총합이 입력되었습니다.


2) 측정값에 남녀 조건 추가하기


이때 Qlik의 Set Analysis 개념이 필요합니다.

중괄호 { } 안의 조건으로 측정값을 한정한다고 생각하면 됩니다.

차트 속성 > 데이터 > 측정값 > 측정값 수정

현재까지의 Sum(성별) 측정값은 남녀 구별 없이 모두 통합된 값이므로 남녀에 따라 측정값을 구분합니다.

측정값으로 추가한 ‘SUM’ 표현식을 수정합니다.


성별이 ‘남자’에 해당하는 ‘건강보험적용인구수’의 합


성별이 ‘여자’에 해당하는 ‘건강보험적용인구수’의 합



건강보험 적용인구수 중 남자, 여자 각각의 총합이 표현되었습니다.


3) 차트 레이블을 구별하기 쉽도록 수정하기

측정값의 표현식이 레이블로 표시되고 있으므로 각 측정값의 레이블을 수정합니다.



차트의 레이블이 각각의 성별로 구분되기 쉽게 변경되었습니다.



4) 측정값 수치 반전을 이용한 측정값 비교

위 사진과 같이 표현되었다면, 다음으로는 각 측정값을 대비되도록 표시하여 남녀 성별 기준으로 한눈에 비교할 수 있도록 변경해보겠습니다.



‘-SUM’으로 표현한 이유는 막대그래프 막대를 음수 방향으로 표시하기 위함입니다.

기존에는 0 기준에서 양수 방향으로 합계로 만들어지는데, ‘-‘ 를 표시해주면 음수 방향으로 만들어지는 것을 확인할 수 있습니다.





4. 양방향 히스토그램 모양으로 차트 변경하기


차트의 모양을 변경합니다.

차트 속성 > 모양 > 스타일링

현재까지 만들어진 ‘그룹화’, ‘세로’ 막대차트 스타일을 ‘누적’, ‘가로’로 변경합니다.




5. 내림차순 기준으로 연령 정렬하기


성별에 따른 인구수가 연령을 기준으로 순차적 나열이 되도록 정렬합니다.

차트 속성 > 정렬 


정렬을 ‘연령’ 기준으로 변경합니다.


연령을 기준으로 막대가 정렬이 됩니다. 


자동으로 되어있는 연령을 사용자 지정으로 변경하고 옵션을 수정합니다.  


이때 '연령' 필드의 데이터 값은 문자 값이므로 ‘사전 순 정렬’에 해당됩니다.


연령의 정렬을 ‘오름차순’에서 ‘내림차순’으로 변경합니다.



연령에 따른 분포를 건강보험적용 인구수를 남녀 기준으로 비교하는 그래프가 완성되었습니다.



reference

시각화 차트 종류 14종 : 한눈에 들어오는 가치를 잡아주기 

Data Visualization – How to Pick the Right Chart Type?



► 클릭 센스 30일 무료 체험 신청하기

https://bit.ly/3jHK0l8


 클릭 센스 9월 무료교육 안내(9/15)

https://blog.naver.com/gtplus1/222490134949




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari