brunch

You can make anything
by writing

C.S.Lewis

by 브래드 Dec 21. 2022

Power BI, 데이터 요리하기

feat. Power Query Editor

안녕하세요, 브래드입니다. 


오늘은 Power BI 내에서 Power Query Editor를 활용하여 데이터 정제 작업을 함께 공부해 볼게요.



Power Query Editor

Power Query Editor 실행하기

Power Query Editor는 홈 리본메뉴에서 데이터 변환을 클릭하여 실행할 수 있습니다.


해당 기능을 활용하여 데이터 연결, 준비 및 변환 등의 작업을 수행할 수 있습니다.




Power Query Editor: 홈 탭

Power Query Editor을 실행하면 다음과 같은 화면을 볼 수 있습니다.


열 혹은 행을 선택하여 제거 등의 기능을 수행할 수 있으며, 분할그룹화 등도 수행할 수 있습니다.


또한, 데이터 형식을 숫자 혹은 문자로 변환이 가능하며 첫 행을 머리글로 사용하여 원하는 데이터 값을 머리글로 사용할 수 있습니다.




Power Query Editor: 변환, 열 추가 탭

홈 탭 이외에도 변환 및 열 추가 탭 내에서도 다양한 기능을 수행할 수 있습니다.


변환 탭에서는 값 바꾸기 및 데이터 추출 등의 기능을 활용하여 데이터를 변환하는 작업을 수행할 수 있으며, 열 추가 탭에서도 추출 및 날짜, 시간 등의 기능을 활용할 수 있습니다.





Power Query Editor: 데이터 미리 보기

Power Query Editor: 보기 탭 활용

Power Query Editor 내에서 보기 탭을 활용하여 데이터를 미리 확인하는 것이 가능합니다.


공백 표시는 디폴트 값으로 체크되어 있으며, 열 분포를 활성화하여 상이 값과 고유 값을 확인할 수 있고 열 품질을 활성화하여 유효/오류/빈값을 체크할 수 있습니다.





Power Query Editor: 데이터 변환작업

데이터 뷰: 열 도구 활용

Power Query Editor를 실행하기 전, 데이터 뷰 내에서 데이터 변환 작업을 진행할 수 있습니다.


데이터를 변환하고 싶은 해당 열을 선택한 후, 이름 혹은 데이터 형식 및 서식 또한 다양하게 변환할 수 있습니다.


또한, 쉼표 및 퍼센트 등 엑셀에서 기본적으로 사용할 수 있던 대부분의 기능을 Power BI 내에서도 사용 가능합니다.




 

Power Query Editor: 행 유지/제거

Power Query Editor 내에서 작업하고자 하는 행을 유지 혹은 제거할 수 있습니다.


특히, 행 제거에 있어서 상위 항목, 하위 항목, 중복된 항목 등을 설정하여 제거할 수 있어서 간편하게 데이터를 처리할 수 있습니다.




Power Query Editor: 필터링 기능

필터링 기능을 활용하여 원하는 데이터만을 추출하여 확인할 수 있습니다.


해당 기능은 엑셀 내에서 활용할 수 있는 기능과 흡사하며, 연도 및 카테고리 등의 구분에 있어서 유용하게 활용할 수 있습니다.




Power Query Editor 필터링 기능 후 보고서에 나타내기

필터링 기능을 활용하여 원하는 년도만 불러온 후 저장하여 보고서에 시각화하여 나타낸 모습입니다.


이렇게 필터링 기능을 활용하여 사용자에 입맛에 맞는 데이터를 손쉽게 불러올 수 있습니다.




Power Query Editor: 값 바꾸기

Power Query Editor 내에서 값 바꾸기를 통해 간편하게 우리가 원하는 명칭으로 변환이 가능합니다.


예시에서는 platform_type 컬럼 내 모바일쇼핑이라는 항목을 모바일쇼핑(아이폰)으로 바꾸어주는 모습입니다. 이를 통해 해당 컬럼 내 모바일쇼핑이라는 이름을 가지고 있는 모든 데이터가 모바일쇼핑(아이폰)으로 바뀌게 됩니다.




Power Query Editor: 열 분할

2019/1/14과 같이 년도와 월, 일을 모두 포함한 데이터가 존재한다면 연도 혹은 월, 일 각각의 데이터끼리 분석이 어려울 것입니다.


따라서, 이러한 경우에는 연도와 월, 일을 나누어주는 것이 필요한데 Power BI에서는 열 분할을 통해 간편하게 실행할 수 있습니다.


구분기호 기준, 문자 수 기준 등 다양한 기준이 있으며 예시에서는 '패션 의류'를 공백을 기준으로 나누어준 모습입니다. 2019/1/14일 경우에는 사용자 지정으로 '/'를 입력하여 2019, 1, 14로 각각 나누어 줄 수 있습니다.




Power Query Editor: 적용된 단계

Power Query Editor 오른쪽 공간을 확인해보면 적용된 단계라는 공간을 확인할 수 있습니다.


이는 현재까지 어떠한 작업을 진행했는지 확인할 수 있으며, 삭제를 통해 이전 단계로 돌아갈 수 있습니다. 다만, 중간 단계를 삭제할 경우 이후에 진행했던 작업에도 영향을 미칠 수 있기 때문에 주의할 필요가 있습니다.




지금까지 Power BI 내에 존재하는 Power Query Editor를 활용하여 데이터 변환 작업에 대해 함께 공부해 왔습니다.


다음 시간에도 Power Query Editor를 활용하여 데이터를 다뤄보는 작업을 함께 진행해 볼게요.


브래드였습니다. 감사합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari