2024년 4월 19일 출판
요즘 가장 많이 구하는 인력인 데이터 분석 전문가로 시작할 수 있게 해주는 책.
다양한 요청사항을 분석할 수 있도록 해준다.
예제가 다양해서 여러 번의 반복 학습으로 실력을 200점 높여준다.
분석 전문가로 어떤 걸 해야 하는지 알려준다.
길벗 출판사에서 책을 제공받아 작성된 서평입니다.
주피터 노트북 설치와 분석 라이브러리 설치는 기본이다.
많은 분석 서비스에서 이 환경을 사용한다.
이 책을 통해 한번 정리해 두면 앞으로 자주 사용할 때 도움이 된다.
이 책에서 상세하게 그림 포함해서 설명해 준다.
1
주피터 노트북으로 분석 환경 세팅할 수 있게 해 준다.
주피터 노트북은 파이썬을 활용해 개발 또는 분석을 하게 해주는 개발 환경.
2
분석을 위해 분석 라이브러리 설치가 필요하다.
konlpy 한글 분석할 때 사용하는 분석 라이브러리 설치한다.
konlpy 라이브러리는 자바로 만들어서 자바도 함께 설치한다.
3
주피터 노트북 설치
아나콘다를 설치하면 주피터 노트북이 포함되어 설치된다.
// 나는 주피터 노트북 사용법을 알게 된다.
4
파이썬 기초를 알려준다.
핵심적인 내용만 요약해서 정리해 준다.
// 나는 파이썬 기초 문법을 알게 된다.
5
판다스에 대해 잘 알려준다.
데이터 분석을 하다 보면 판다스는 기본으로 사용한다.
판다스를 사용하려면 데이터 처리 라이브러리인 넘파이도 필요하다.
판다스로 데이터 프레임 형태 조절, 데이터 추출 등 다양한 실습으로 잘 쓸 수 있게 해 준다.
판다스를 이번에 마스터하자~~
아주 많이 쓰는 라이브러리다.
// 나는 이제 판다스를 사용할 수 있게 된다.
6
경기도 인구 데이터 분석?
판다스로 분석한다.
데이터를 경기 데이터 드림 사이트에서 받아 실습하도록 해준다.
시각화까지 하게 해 준다.
7
국민건강보험 공단 진료 내역 분석?
국민건강보험 공단 진료 내역 정보 전처리해 보자.
다른 데이터와 합치기를 배운다.
1
크롤러와 스트래퍼의 차이를 알게 된다.
크롤러 = 특정 웹 사이트 내 모든 하이퍼링크를 순회하면서 잘 수집.
스크래퍼 = 웹 페이지에서 필요한 부분만 수집.
2
스크레퍼 알아보기
html 기초 지식
html 파일 생성.
간단한 스크래퍼 만들기를 한다.
// 나는 이제 스크래퍼를 만들 수 있다.
HTML 수집과 파싱을 알아보자
정보 수집
html 파싱 하는 법도 배운다.
3
URL을 찾을 수 없어 웹 페이지를 수집 못하면???
무엇이든 수집하는 selenuim 라이브러리 사용법을 알게 된다.
유튜브 음악 탭의 동일한 URL을 구분해 받을 수 있게 해 준다.
네이버 카페의 웹 사이트 정보를 수집할 수 있게 해 준다.
1
수집한 데이터로 다양한 고객의 요청사항을 분석해 주는 예제로 분석 전문가로 만들어 준다.
2
고객의 요청사항????
내가 그 편의점만 가는 이유?
어떤 떡볶이가 맛있을까?
2040 여성들의 건강 고민 살피기?
내 여자친구 최애 쿠션 찾아주기?
자연어 분석 심화 편?
3
분석 순서???
내가 그 편의점만 가는 이유?
데이터 불러오기
데이터 전처리
데이터 분석
결과 1차 정리
4
어떤 떡볶이가 맛있을까?
데이터 불러오기
데이터 전처리
데이터 불러오기
데이터 전처리
데이터 분석
5
2040 여성들의 건강 고민 살피기?
데이터 불러오기
데이터 분석
형태소 분석
데이터 불러오기
데이터 전처리
데이터 분석
6
내 여자친구 최애 쿠션 찾아주기?
데이터 가져오기
데이터 전치리
해시태그 전처리
자연서 분석 심화?
데이터 분석
데이터 전처리
토픽 모델링
데이터 전치리데이터 분석
서비스 제안
이 책을 통해 데이터 분석 환경 세팅법을 알게 된다.
데이터 수집법을 알게 된다.
수집한 데이터로부터 분석하는 법을 배운다.
다른책 보기
https://brunch.co.kr/@topasvga/878
감사합니다.