brunch

You can make anything
by writing

C.S.Lewis

by Cheon Feb 21. 2017

[데이터 정리] 집합(Set)





1. ‘집합’이란 무엇인가?




어떤 조건을 기반으로 하는 사용자 지정 필드이다. 쉽게 말하면, 사용자가 직접 어떤 조건을 설정하고, 그 조건을 기반으로 만들어진 필드이다.


예를 들어, ‘Sales’가 많은 상위 10개의 'Order ID’(어떤 조건)를 가지고 집합을 만들면 그 조건에 해당하면 ‘IN’, 아니면 ‘OUT’으로 나눠진다.







2. ‘집합' 만드는 방법





차트에서 드래그하여 ‘집합' 만들기



◆ 다음과 같은 차트를 만들자.



◆ ‘Profit’이 $15,000 이상인 ‘사각형’을 드래그하자.



◆ 오른쪽에서 두번째에 있는 ‘집합 만들기…'를 클릭하자.



◆ 이름을 ‘$15,000 이상 수익’이라 하고, ‘확인’을 클릭하자.



그러면, 다음과 같이 집합이 만들어진다.



◆ 위 집합(‘$15,000 이상 수익’)을 색상으로 드래그하자.


그러면 다음과 같이, $15,000 이상 수익을 가진 사각형(집합 IN)과 나머지(집합 OUT)를 구분할 수 있는 차트가 만들어진다.








하나의 차원을 가지고 ‘집합' 만들기



◆ 다음과 같은 차트를 만들자.



◆ ‘Order ID’에 마우스 오른쪽 버튼을 클릭하고, ‘만들기 - 집합’을 클릭하자.



◆ 이름을 ‘Discount > 5%’라고 하고, ‘조건’을 클릭하자.

◆ ‘필드 기준’을 체크하고, ‘Discount’, ‘평균’, ‘>’, ‘0.05’를 입력하고, ‘확인’을 클릭하자.



그러면, 다음과 같이 집합이 만들어진다.



◆ 위 집합(‘Discount > 5%’)을 색상으로 드래그하자.




그러면 다음과 같은 차트가 만들어진다.



위 차트는 각 ‘Order ID’의 ‘Discount’가 5% 초과('집합 IN')인지 아닌지('집합 OUT')를 기준으로, 각 분기에서 두 가지 원으로 나뉘어진다.







결합된 ‘집합’ 만들기  



두 개의 집합을 결합할 때는 두 개의 집합이 '같은 차원'으로 만든 집합이어야 한다.


먼저, 결합할 두 개의 집합을 만들어보자.



◆ ‘Order ID’를 마우스 오른쪽 버튼으로 클릭하고, ‘만들기 - 집합’을 클릭하자.



 이름을 ‘Top 20 by Sales’라 하고, ‘상위’를 클릭하자.

◆ ‘필드 기준’을 체크하고, ‘상위’, ’20’, ‘Sales’, ‘합계’를 입력하고, ‘확인’을 클릭하자.



다시 한번 ‘Order ID’를 기준으로 집합을 만들자.



◆ 이름을 ‘Top 20 by Profits’라 하고, ‘상위’를 클릭하자.

◆ ‘필드 기준’을 체크하고, ‘상위’, ’20’, ‘Profit’, ‘합계’를 입력하고, ‘확인’을 클릭하자.



그러면, 다음과 같이 두 개의 집합이 만들어진다.



◆ 두 집합을 클릭하고, ‘결합된 집합 만들기’를 클릭하자.



◆ 이름을 ‘Top Order ID by Profits and Sales’라 하고, ‘두 집합의 공유 멤버’를 체크하고, ‘확인’을 클릭하자. (결합된 집합 중 집합을 만드는 목적에 따라 다른 집합의 종류를 선택해서 만들면 된다.)



위 결합된 집합은 ‘Profits’를 기준으로 상위 20 Order ID와 ’Sales’를 기준으로 상위 20 Order ID 사이에 공통으로 포함되는 'Order ID'를 갖는 집합이다.




그러면, 다음과 같이 '결합된 집합'이 만들어진다.



◆ 위 집합(‘Top Order ID by Profits and Sales’)과 ‘Order ID’를 행으로 드래그하자.



위의 경우, ‘Profits’를 기준으로 상위 20 Order ID와 ’Sales’를 기준으로 상위 20 Order ID 사이에 공통으로 포함되는 'Order ID'가 없기 때문에 ‘IN’이 없고, ‘OUT’만 존재한다.



  






3. ‘집합' 적용해 보기





Q: Category의 Technology 중에서, ‘Sales’를 기준으로 상위 10 Order ID의 총 Sales의 값은 얼마일까?



◆ ‘Order ID’에 마우스 오른쪽 버튼을 클릭하고, ‘만들기 - 집합’을 클릭하자.



◆ 이름을 ‘Top 10 Order ID by Sales’라 하고, ‘상위’를 클릭하자.

◆ ‘필드 기준’을 체크하고, ‘상위’, ’10’, ‘Sales’, ‘합계’를 입력하고, ‘확인’을 클릭하자.



그러면, 다음과 같이 '집합'이 만들어진다.



◆ ‘Category’와 위 집합(‘Top 10 Order ID by Sales’)을 행으로 드래그하자.

◆ ‘Sales’를 열과 레이블에 드래그하자. 

◆ 위 집합(‘Top 10 Order ID by Sales’)을 색상으로 드래그하자.


그러면 다음과 같은 그래프가 나온다.



Technology 중 ‘IN’에 있는 Sales의 값(‘$105,266’)이 Sales를 기준으로 한 상위 10개의 Order ID의 총 Sales의 값이다.

매거진의 이전글 [데이터 정리] 정렬(Sort)
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari