brunch

You can make anything
by writing

C.S.Lewis

by 최반장 Jul 05. 2020

1.2 데이터 전처리

Section 1. 도메인의 이해와 데이터 전처리


이 강의는 인프런에서 온라인으로 만나보실 수 있습니다.

아래 링크를 클릭하면 강의 페이지로 이동합니다.

최반장의 피벗 테이블 마스터 클래스 (https://bit.ly/pmc_inflearn)




선생님의 거품

제가 고등학교 때 만난 어느 사투리가 심한 선생님께서 학기 초에 대청소를 할 때 어느 학생에게 지시를 하셨습니다.
'야! 교무실에 내 자리 가서 거품 갖고 와! 거품!'
그 학생은 잘 이해는 안됐지만 선생님이 무서웠던 그 학생은 일단 교무실로 뛰어 갔습니다. 아무리 찾아도 교무실에는 거품이 없었고 빈 손으로 돌아왔습니다.
'선생님... 교무실에 거품이 없습니다 ㅠㅠ'
'야 무슨 소리야 내가 액자에다가 잘 끼어서 책상에 올려놨는데! 그 큰걸 왜 못찾아!"
액자라는 말을 들은 순간 학생은 그제서야 깨달았습니다.
선생님이 갖고 오라고 하신 것은 거품이 아니라 급훈 이었습니다.


데이터를 입력한 선생님 입장에서는 급훈이었지만 데이터를 처리하는 학생 입장에서 거품이라고 인식된다면 이것은 크게 잘못된 상황이죠.


데이터 전처리

이번 시간에는 데이터분석의 필수 절차인 데이터 전처리에 대해서 알아보겠습니다.
우리가 자주 만날 수 있는 분석에 적합하지 않은, 피해야 하는 5가지 상황을 소개해 드리고 엑셀에서 각각에 대한 대처방법을 공부해 보도록 하겠습니다.
1. 같은 열의 데이터는 하나의 동일 형식 데이터만 사용해 주세요
2. 텍스트로 서식이 지정된 숫자는 숫자로 변환해 주세요
3. 열 머리글(제목)은 고유값으로 알기 쉽게 지정해 주세요
4. 셀을 병합하지 마세요.
5. 셀을 비워두지 마세요.




Microsoft Support

병합된 셀을 찾는 방법
텍스트 나누기 마법사로 텍스트를 여러 열로 나누기
숫자 서식을 적용하여 텍스트 서식이 지정된 숫자 수정 특정 조건에 맞는 셀 찾기 및 선택



https://youtu.be/mKQLIgVypcE

매거진의 이전글 1.1 학습용 데이터 탐색
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari