brunch

You can make anything
by writing

C.S.Lewis

by GTPlus Mar 10. 2022

정규분포(Normal distribution) 표현하기

콤보차트와 Normdist 함수를 활용

안녕하세요.

GTPlus 김대리입니다. BI 솔루션 클릭(Qlik) 튜토리얼 벌써 열네번째 시간이네요.


오늘은 콤보차트와 Normdist 함수를 활용하여 정규분포를 표현해보려고 합니다.


다양한 차트를 이용하여 정규분포를 표현하는 예제를 소개할게요.

사용되는 차트는 아래와 같습니다! 


히스토그램

KPI

콤보차트

라인 차트


KPI차트를 활용하여 수식 값의 정합성을 확인하고 히스토그램을 이용해서 빈도를 표현하고,  콤보차트를 이용해서 벨커브 형태의 정규분포표를 표현하고, 라인 차트를 이용해서 분포에 대한 영역을 색상으로 표현해보는 것 까지 해보겠습니다!  


시험 응시자 50명을 기준으로 시험결과를 사용하도록 하겠습니다. 두 개의 필드로 구성된 엑셀 데이터입니다.



자, 그럼 Qlik Sense에 엑셀 파일을 추가하고 아래 단계를 진행해볼까요?





1. 히스토그램을 이용한 빈도


먼저 히스토그램을 이용하여 평가점수의 빈도를 나타냅니다.

히스토그램에 추가하는 단일 필드가 숫자값을 가질 때 빈도로 표시됩니다.





2. 콤보차트를 이용한 분포


콤보차트를 이용하여 표준정규분포표를 생성해보겠습니다.



2-1. 빈도 표시


먼저 차원과 측정값으로 각 필드를 추가합니다.

차원 : 평가점수

측정값 : count(번호)



class 함수를 이용해 평가점수 필드를 5점 단위의 Basket으로 묶어줍니다.


class 함수를 두번째 요소를 기준으로 간격을 나눕니다.


replace 함수를 이용하여 '<=x<'로 표시되는 점수 간 범위를 '~'로 표시되게 합니다.



필드 레이블도 변경해줍니다.

추가한 차원과 측정값 기준으로 기본 막대 그래프가 생성되었습니다.

여기에 또 다른 측정값을 추가합니다.



2-2. 분포 표시


1) Normdist 함수


차원과 첫번째 측정값을 추가한 후, 추가 측정값을 Normdist와 Stdev함수를 이용하면 분포도를 표현할 수 있습니다. 아래 수식을 이용하여 측정값으로 추가합니다.


NORMDIST(value, [mean], [standard_dev], [cumulative])


* Normdist 함수는 지정된 평균 및 표준 편차에 대한 누적 정규 분포를 반환하며, 다음과 같은 4개의 인수를 입력하여 사용합니다. 


① Value : 분포를 평가할 기준값

 [mean] : 분포의 산술 평균. (인수 미지정 시 기본값은 0임)

 [standard_dev] : 분포의 표준편차 Stdev 함수 사용

 [cumulative] : 표준 정규 분포 또는 누적 분포 결정 (0 = 표준 정규 분포, 1 = 누적 분포)




측정값으로 입력하기 전에 KPI 차트를 활용하여 각각의 값을 확인합니다.


2) 두번째 측정값 추가


수식을 이용하여 측정값을 추가하고 레이블을 변경합니다.



① 각 구간의 평균점수를 기준으로 분포 평가

② 전체 평가점수의 평균값

③ 전체 평가점수의 표준편차

④ 표준 정규 분포


각 구간 안의 평가점수의 평균을 기준으로 분포를 계산하여 정규분포로 나타내는 수식입니다.

분포가 라인으로 추가되었습니다.


3) 표식으로 변경


라인으로 추가된 '분포' 측정값을 표식으로 변경합니다.



4) 색상 변경

그래프에 나타나는 정보를 풍부하게 나타내기 위해 추가적인 색상 변경을 진행합니다.

측정값 '평가점수'기준으로 색상의 순차 그라데이션을 선택합니다.



측정값 '분포'까지도 모두 색상 변경이 되었기 때문에, '분포'는 단색으로 변경해줍니다. 





 시험 응시자 50명 기준으로 시험 점수에 대한 분포가 콤보차트로 완성되었습니다. 





3. 라인 차트를 이용한 분포


꺾은선형 차트를 활용하여 분포를 영역으로 표시해보겠습니다.

'시험 점수' 차원을 마스터 항목 차원으로 추가하고, '시험점수' 측정값을 마스터 항목 측정값으로 각각 생성한 뒤 꺾은선형 차트에 추가합니다.

마스터 항목 차원 : 시험점수

 

마스터 항목 측정값 : 시험 점수


추가한 필드 기준으로 라인 차트가 생성되었습니다.


분포를 표시하는 꺾은 선을 곡선으로 변경해줍니다.

선 곡선 타입을 '모노톤'으로 선택하면 됩니다.



분포의 영역을 표현하기 위해서 영역에 색상을 채웁니다.




시험 점수 그룹에 대한 분포가 라인차트로 완성되었습니다.




모두 완성된 모습은 아래와 같습니다.





잘 따라해보셨나요? 예제 파일로 직접 따라해보시길 바라며 더 자세한 내용은 아래 유튜브 동영상을 통해 확인이 가능합니다.

그럼 다음 김대리의 클릭에서 또 만나요!


https://youtu.be/E0X2RdRaQak



► 클릭 센스 30일 무료 체험 신청하기

https://bit.ly/3jHK0l8


► 클릭 센스 문의하기

http://www.gtplus.co.kr/etc



        

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari