brunch

You can make anything
by writing

C.S.Lewis

by Master Seo May 16. 2022

(책)배워서 바로 써먹는 데이터 분석  WITH 파이썬

2022년 4월 출간


이 책은 생능 출판사의 이벤트에  당첨되어 후기를  쓰기로 한 조건으로 받아 작성한 글입니다.

개인이 읽고 솔직히 작성합니다.



<0> 개인 의견

<1>  준비하기

<2> 파이썬 다루기

<3> 데이터 분석을 위한 라이브러리

<4> 크롤링

<5> 데이터 수집 , 전처리 , 시각화

<10> 개인 요약

<20> 같이 보면 좋은 책?




<0> 개인 의견


이 책은 파이썬과 파이썬 모듈로 다양한 데이터 분석을 할수 있게 해준다.

파이썬으로 코딩하여 데이터 수집에서 분석, 시각화까지 모두 파이썬으로 할 수 있게 해주는 책이다.

진정 파이썬으로 모두 처리한다.

코딩의 노고가 많이 들어가는거 같다

파이썬으로 데이터 처리하는 고수가 될 수 있게 해주는 책이다.


저자 이력으로 봐서 저자는 계속 개발을 해온 분이다.

그래서 개발 관점에서 분석 실무 관점에서 작성된 책으로 판단된다.


요즘은 데이터 수집, 전 저리는 제외하고는 대부분 클라우드에서 처리를 해주고 있다.

분석, 시각 화등은 클라우드에서 처리해준다.



자~  이제 책을 살펴보자~




<1>  준비하기


1

데이터 분석이란?


다방면에서 데이터를 수집한 다음 재가공 처리하여 유의미한 데이터로 가치를 창출하는 과정이다.


2

데이터 분석  5단계?


요구 사항 파악

데이터 수집

데이터 전처리

데이터 분석

데이터 시각화


3

요구 사항 파악?


개인적으로 제일 중요한 과정이라 생각한다.

어떤 문제가 있는지 확인하는 것이다.

요구 사항 파악에 따른 데이터 수집이라는 과정을 거친다.


4

데이터 수집?

공공 데이터를 사용할 수 있는 경우도 있지만, 못 사용하는 경우도 있다.

이런 경우 수집한다.


5

데이터 전처리?

사용자가 처리하는 작업이 가장 많은 작업이다.

데이터 중복이나 누락, 오류 등을 정리한다.



6

데이터 분석?

전처 리시 정보를 얻어내거나

더 많은 데이터를 수집해야 하는 경우도 있다.


7

데이터 시각화?

텍스트 형식의 데이터를 사용하는 경우 눈에 뜨이지 않는 경우가 많다.

그래프 형태로 주로 나타 낸다.




<2> 파이썬 설치해서 사용해보자.


파이썬 설치하는 방법 2가지


1

기본 툴 설치하는 법


2

라이블러리가 설치된 아나콘다 설치하는 법



3

여기서는 기본 툴을 설치해 사용한다.


https://www.python.org/

다운로드에서 설치한다.


4

파이썬 개발 툴인  파이 참을 설치해보자.


https://www.jetbrains.com/ko-kr/pycharm/

다운로드

무료 버전인 커뮤니티 버전을 설치하자.


설치 시

ADD LAUNCHERS DIR TO THE PATH   체크하고 설치하자.


설치 완료



5

파이 참 세팅?

파일 - 세팅


6

File - New로 사용해보자~


7

외부 라이브러리 설치하는 법?

pip install  라이브러리 이름

// 자세한 설정법은 책에 있습니다 ^^



8

오라클 준비?

윈도 환경에서  Oracle Database 11g Express Edition  버전 설치를 한다.

// 자세한 설치법은 책에~




<2> 파이썬 다루기


1

내용?

기초 문법

내장 함수와 클래스

파일 입출력

프로젝트 : 미성년자 체크 프로래 만들기



2

예제



3

파일 입출력 예제


파일을 읽어 다른 파일에 기록하는 법이 나온다.





<3> 데이터 분석을 위한 라이브러리


1

각종 라이브러리를 설치해서 데이터 분석을 할 수 있도록 한다.



2

시각화



<4> 크롤링


웹 사이트 데이터 수집을 하기 위해 크롤링하는 법을 알려준다.

데이터 수집 용도로 크롤링이 필요하다.






<5> 데이터 수집 , 전처리 , 시각화



전처리






시각화




<10> 개인 요약


1

데이터 분석  5단계?


요구 사항 파악

데이터 수집

데이터 전처리

데이터 분석

데이터 시각화


2

여기서는 파이썬과 파이썬 모듈로  테이터 분석 5단계 처리를 모두 다한다.

크롤링을 통해 데이터 수집하고, 파이썬 모듈로  전처리, 분석, 시각화까지 모두 코딩하는 법을 알려줍니다.

파이썬을 통해  분석을 1권의 책으로 모두 해결하게 해 줍니다.

A부터 Z까지 모든 부분을 잘 알려주는 책입니다.


3

빅데이터 처리의 경우는  요즘 클라우드에서  많은 부분을 해준다.

데이터 분석 , 데이터 시각화의 경우 클라우드 서비스로  제공됩니다.

AWS EMR, 퀵 사이트 등



<20> 같이 보면 좋은 책?


1

데이터 수집에 도움 되는 책

https://brunch.co.kr/@topasvga/2356



2

클라우드로 데이터 처리하는 법 참고

https://brunch.co.kr/@topasvga/1766



3

파이썬 실행 툴


https://brunch.co.kr/@topasvga/2436



4

같이 볼만한 책

https://brunch.co.kr/@topasvga/878



다른책 보기

https://brunch.co.kr/magazine/it-book

감사합니다.

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari