Section 1. 도메인의 이해와 데이터 전처리
이 강의는 인프런에서 온라인으로 만나보실 수 있습니다.
아래 링크를 클릭하면 강의 페이지로 이동합니다.
최반장의 피벗 테이블 마스터 클래스 (https://bit.ly/pmc_inflearn)
제가 고등학교 때 만난 어느 사투리가 심한 선생님께서 학기 초에 대청소를 할 때 어느 학생에게 지시를 하셨습니다.
'야! 교무실에 내 자리 가서 거품 갖고 와! 거품!'
그 학생은 잘 이해는 안됐지만 선생님이 무서웠던 그 학생은 일단 교무실로 뛰어 갔습니다. 아무리 찾아도 교무실에는 거품이 없었고 빈 손으로 돌아왔습니다.
'선생님... 교무실에 거품이 없습니다 ㅠㅠ'
'야 무슨 소리야 내가 액자에다가 잘 끼어서 책상에 올려놨는데! 그 큰걸 왜 못찾아!"
액자라는 말을 들은 순간 학생은 그제서야 깨달았습니다.
선생님이 갖고 오라고 하신 것은 거품이 아니라 급훈 이었습니다.
데이터를 입력한 선생님 입장에서는 급훈이었지만 데이터를 처리하는 학생 입장에서 거품이라고 인식된다면 이것은 크게 잘못된 상황이죠.
이번 시간에는 데이터분석의 필수 절차인 데이터 전처리에 대해서 알아보겠습니다.
우리가 자주 만날 수 있는 분석에 적합하지 않은, 피해야 하는 5가지 상황을 소개해 드리고 엑셀에서 각각에 대한 대처방법을 공부해 보도록 하겠습니다.
1. 같은 열의 데이터는 하나의 동일 형식 데이터만 사용해 주세요
2. 텍스트로 서식이 지정된 숫자는 숫자로 변환해 주세요
3. 열 머리글(제목)은 고유값으로 알기 쉽게 지정해 주세요
4. 셀을 병합하지 마세요.
5. 셀을 비워두지 마세요.
병합된 셀을 찾는 방법
텍스트 나누기 마법사로 텍스트를 여러 열로 나누기
숫자 서식을 적용하여 텍스트 서식이 지정된 숫자 수정 특정 조건에 맞는 셀 찾기 및 선택