brunch

You can make anything
by writing

C.S.Lewis

by Master Seo May 07. 2024

(책후기) 고객 니즈가 보이는 데이터 분석with파이썬

2024년 4월 19일 출판

요즘 가장 많이 구하는 인력인 데이터 분석 전문가로 시작할 수 있게 해주는 책.


다양한 요청사항을 분석할 수 있도록 해준다.

예제가 다양해서 여러 번의 반복 학습으로 실력을 200점 높여준다.

분석 전문가로 어떤 걸 해야 하는지 알려준다.



길벗 출판사에서 책을  제공받아 작성된 서평입니다.



이 책에서 배울 수 있는 것


<1> 데이터 분석 환경 세팅법을 알게 된다.

<2> 데이터 수집법을 알게 된다.

<3> 수집한 데이터로부터 분석하는 법을 배운다.

<4> 개인 정리




<1> 데이터 분석 환경 세팅법을 알게 된다.


주피터 노트북 설치와 분석 라이브러리 설치는 기본이다.

많은 분석 서비스에서 이 환경을 사용한다.

이 책을 통해 한번 정리해 두면 앞으로 자주 사용할 때 도움이 된다.

이 책에서 상세하게 그림 포함해서 설명해 준다.



1

주피터 노트북으로 분석 환경 세팅할 수 있게 해 준다.

주피터 노트북은 파이썬을 활용해 개발 또는 분석을 하게 해주는 개발 환경.



2

분석을 위해 분석 라이브러리 설치가 필요하다.

konlpy 한글 분석할 때 사용하는 분석 라이브러리 설치한다.

konlpy 라이브러리는 자바로 만들어서 자바도 함께 설치한다.



3

주피터 노트북 설치

아나콘다를 설치하면 주피터 노트북이 포함되어 설치된다.

// 나는 주피터 노트북 사용법을 알게 된다.



4

파이썬 기초를 알려준다.

핵심적인 내용만 요약해서 정리해 준다.

// 나는 파이썬 기초 문법을 알게 된다.



5

판다스에 대해 잘 알려준다.

데이터 분석을 하다 보면 판다스는 기본으로 사용한다.

판다스를 사용하려면 데이터 처리 라이브러리인 넘파이도 필요하다.

판다스로 데이터 프레임 형태 조절, 데이터 추출 등 다양한 실습으로 잘 쓸 수 있게 해 준다.

판다스를 이번에 마스터하자~~

아주 많이 쓰는 라이브러리다.

// 나는 이제 판다스를 사용할 수 있게 된다.



6

경기도 인구 데이터 분석?

판다스로 분석한다.

데이터를 경기 데이터 드림 사이트에서 받아 실습하도록 해준다.

시각화까지 하게 해 준다.



7

국민건강보험 공단  진료 내역 분석?

국민건강보험 공단 진료 내역 정보 전처리해 보자.

다른 데이터와 합치기를 배운다.





<2> 데이터 수집법을 알게 된다.



1

크롤러와 스트래퍼의 차이를 알게 된다.

크롤러 = 특정 웹 사이트 내 모든 하이퍼링크를 순회하면서 잘 수집.

스크래퍼 = 웹 페이지에서 필요한 부분만 수집.



2

스크레퍼 알아보기

html 기초 지식

html 파일 생성.

간단한 스크래퍼 만들기를 한다.

// 나는 이제 스크래퍼를 만들 수 있다.


HTML 수집과 파싱을 알아보자

정보 수집

html 파싱 하는 법도 배운다.



3

URL을 찾을 수 없어 웹 페이지를 수집 못하면???

무엇이든 수집하는 selenuim 라이브러리 사용법을 알게 된다.

유튜브 음악 탭의 동일한 URL을 구분해 받을 수 있게 해 준다.

네이버 카페의 웹 사이트 정보를 수집할 수 있게 해 준다.




<3> 수집한 데이터로부터 분석하는 법을 배운다.



1

수집한 데이터로 다양한 고객의 요청사항을 분석해 주는 예제로 분석 전문가로 만들어 준다.



2

고객의 요청사항????

내가 그 편의점만 가는 이유?

어떤 떡볶이가 맛있을까?

2040 여성들의 건강 고민 살피기?

내 여자친구 최애 쿠션 찾아주기?

자연어 분석 심화 편?



3

분석 순서???



내가 그 편의점만 가는 이유?

데이터 불러오기

데이터 전처리

데이터 분석

결과 1차 정리



4

어떤 떡볶이가 맛있을까?

데이터 불러오기

데이터 전처리

데이터 불러오기

데이터 전처리

데이터 분석



5

2040 여성들의 건강 고민 살피기?

데이터 불러오기

데이터 분석

형태소 분석

데이터 불러오기

데이터 전처리

데이터 분석



6

내 여자친구 최애 쿠션 찾아주기?

데이터 가져오기

데이터 전치리

해시태그 전처리

자연서 분석 심화?

데이터 분석

데이터 전처리

토픽 모델링

데이터 전치리데이터 분석

서비스 제안



<4> 개인 정리


이 책을 통해 데이터 분석 환경 세팅법을 알게 된다.

데이터 수집법을 알게 된다.

수집한 데이터로부터 분석하는 법을 배운다.




다른책 보기


https://brunch.co.kr/@topasvga/878



감사합니다.

매거진의 이전글 (책후기) 실전 스벨트, 스벨트킷 입문-2024
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari