2022년 4월 출간
이 책은 파이썬과 파이썬 모듈로 다양한 데이터 분석을 할수 있게 해준다.
파이썬으로 코딩하여 데이터 수집에서 분석, 시각화까지 모두 파이썬으로 할 수 있게 해주는 책이다.
진정 파이썬으로 모두 처리한다.
코딩의 노고가 많이 들어가는거 같다
파이썬으로 데이터 처리하는 고수가 될 수 있게 해주는 책이다.
저자 이력으로 봐서 저자는 계속 개발을 해온 분이다.
그래서 개발 관점에서 분석 실무 관점에서 작성된 책으로 판단된다.
요즘은 데이터 수집, 전 저리는 제외하고는 대부분 클라우드에서 처리를 해주고 있다.
분석, 시각 화등은 클라우드에서 처리해준다.
요구 사항 파악
데이터 수집
데이터 전처리
데이터 분석
데이터 시각화
개인적으로 제일 중요한 과정이라 생각한다.
어떤 문제가 있는지 확인하는 것이다.
요구 사항 파악에 따른 데이터 수집이라는 과정을 거친다.
공공 데이터를 사용할 수 있는 경우도 있지만, 못 사용하는 경우도 있다.
이런 경우 수집한다.
사용자가 처리하는 작업이 가장 많은 작업이다.
데이터 중복이나 누락, 오류 등을 정리한다.
전처 리시 정보를 얻어내거나
더 많은 데이터를 수집해야 하는 경우도 있다.
텍스트 형식의 데이터를 사용하는 경우 눈에 뜨이지 않는 경우가 많다.
그래프 형태로 주로 나타 낸다.
ADD LAUNCHERS DIR TO THE PATH 체크하고 설치하자.
pip install 라이브러리 이름
윈도 환경에서 Oracle Database 11g Express Edition 버전 설치를 한다.
기초 문법
내장 함수와 클래스
파일 입출력
프로젝트 : 미성년자 체크 프로래 만들기
요구 사항 파악
데이터 수집
데이터 전처리
데이터 분석
데이터 시각화
크롤링을 통해 데이터 수집하고, 파이썬 모듈로 전처리, 분석, 시각화까지 모두 코딩하는 법을 알려줍니다.
파이썬을 통해 분석을 1권의 책으로 모두 해결하게 해 줍니다.
A부터 Z까지 모든 부분을 잘 알려주는 책입니다.
데이터 분석 , 데이터 시각화의 경우 클라우드 서비스로 제공됩니다.
AWS EMR, 퀵 사이트 등
https://brunch.co.kr/magazine/it-book