brunch

You can make anything
by writing

C.S.Lewis

by Cheon Jan 08. 2017

[데이터 연결] 분할 & 사용자 지정 분할이란 무엇인가

데이터의 열(Column) 중에서 여럿 정보들이 포함된 열이 있고, 그 열의 데이터 타입이 ‘문자열'이라면,

“분할”을 하여 여러 개의 열로 나눌 수 있다.


다음과 같은 열이 있다고 해보자.

(‘Customers’의 열은 세 개의 정보를 포함한다. '국가 - 고객 ID - 고객이름’)




◆ 열 옆에 화살표를 클릭하고, ‘분할’을 클릭하자.



그러면 다음과 같이 3개의 열로 분할된다.



하지만, ‘분할'을 사용하지 말아야 할 경우도 있다.


각 행의 값들의 분리기(separator, 예를 들어 ‘-')의 수가 다를 경우



각 행의 값들의 분리기(separator, 예를 들어 ‘-‘, 또는 ‘,')의 종류가 다를 경우




이와 같이, ‘분할'로 부족한 경우가 있기 때문에, 그 대안으로 ‘사용자 지정 분할’을 사용할 수 있다.


다음과 같은 열이 했다고 해보자.

(각 행의 값들의 분리기의 수가 다르다.)



◆ 열 옆에 화살표를 클릭하고, ‘분할’을 클릭하자.



그러면 다음과 같이 두 개의 열로 분할이 된다. 즉, ‘고객이름’은 무시된다.



대신에, '사용자 지정 분할'을 사용해보자.


◆ 열 옆에 화살표를 클릭하고, ‘사용자 지정 분할’을 클릭하자.



‘사용자 지정 분할’을 사용하면 옵션이 여러개가 있다.


◆ ‘구분 기호 사용’에서 ‘-‘을 입력하고, ‘분할 해제’에서 ‘첫 번째’, ‘2열’을 입력하자.




그러면 다음과 같이 첫 번째 값부터 시작해서 2열까지 만들어진다.

(즉, 이 경우에는 '국가 - 고객ID’까지만 분할이 된다.)



◆ ‘구분 기호 사용’에서 ‘-‘을 입력하고, ‘분할 해제’에서 ‘마지막’, ‘2열’을 입력하자.




그러면 다음과 같이 마지막 값부터 시작해서 2열까지 만들어진다.

(즉, 이 경우에는 ‘고객ID - 고객이름’까지만 분할이 된다. 단, ‘고객이름’이 없는 경우에는 마지막 값이 ‘고객ID’이기 때문에, ‘국가 - 고객ID’로 분할이 된다.)



◆ ‘구분 기호 사용’에서 ‘-‘을 입력하고, ‘분할 해제’에서 ‘모두’를 입력하자.



그러면 다음과 같이 모든 값이 분할된다.

(즉, 이 경우에는 ‘국가 - 고객ID - 고객이름’까지 분할이 된다. 단, ‘고객이름’이 없는 경우에는 ‘빈칸’으로 분할된다.)



데이터의 열의 값이나 분리기에 따라 ‘분할’ 또는 ‘사용자 지정 분할’을 잘 사용한다면, 데이터를 잘 정제하여, 

태블로를 이용해 좀 더 효과적인 분석을 할 수 있을 것이다.

매거진의 이전글 [데이터 연결] 데이터 해석기란 무엇인가?
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari