brunch

You can make anything
by writing

C.S.Lewis

by 데이터파머 DataFarmer Feb 23. 2022

[독서 노트] 혼자 공부하는 R 데이터 분석

강전희, 엄동란 저 | 한빛미디어 | 2022년 01월 17일

서평 및 발제


작년 부터 한빛 미디어 책 리뷰를 많이 하고 있다. 실제도 많이 구매도 했었다. IT 분야에 입문을 하다보니 한빛 시리즈의 책들이 잘 정리도 되어있고, 초보부터 고급까지 두루두루 포괄할 수 있도록 책들이 구성되어 있다. 특히 혼공 시리즈는 유튜브 강의와 함께 들으면 백점 만점의 학습 효과를 볼 수 있다.


지금까지 구매한 한빛 미디어 책들 중 혼공 (혼자 공부하는) 시리즈는 파이썬, 머신러닝/딥러닝, R 이고, 그 외에는 딥러닝 관련 책들도 포함하여 10권 가량의 책들을 구매했고, 서평 책들도 10권 이상 받았으니 이정도면 한빛 매니아라고 할 수 있겠다. 이중 안읽은 책들이 반이고, 읽은 책들이 반이다.


2022년 1월~2월은 혼공 딥러닝 머신러닝 그룹 스터디를 진행하고 있지만, 중간에 잠간 쉬어가는 마음으로 잠간 이 책을 보았다. R은 원래 중급 이상으로 다룰 수도 있었고, 지금까지 빅데이터 분석 교육을 온/오프라인으로 들을때면 대부분 R로 진행을 했기 때문에 익숙하기도 하고 친근하다.



목차 및 요약

Chapter 01 빅데이터와 R

01-1 빅데이터와 R 언어

01-2 개발 환경 설치

01-3 R 스튜디오 인터페이스와 환경 설정

Chapter 02 데이터 분석을 위한 기본 다지기

02-1 데이터 분석 과정

02-2 데이터의 생김새

Chapter 03 R 프로그래밍 익히기

03-1 변수와 함수

03-2 패키지

03-3 조건문과 반복문

Chapter 04 데이터 다루기

04-1 데이터 수집하기

04-2 데이터 관측하기

04-3 데이터 탐색하기

Chapter 05 데이터 가공하기

05-1 dplyr 패키지

05-2 데이터 가공하기

05-3 데이터 구조 변형하기

05-4 데이터 정제하기

Chapter 06 데이터 시각화: ggplot2 패키지

06-1 그래프 그리기

06-2 그래프에 객체 추가하기

06-3 지도 시각화: ggmap 패키지

Chapter 07 프로젝트로 실력 다지기

07-1 지역별 국내 휴양림 분포 비교하기

07-2 해외 입국자 추이 확인하기

07-3 지도에서 코로나19 선별진료소 위치 확인하기

07-4 서울시 지역별 미세먼지 농도 차이 비교하기

Chapter 08 데이터 분석 보고서 공유하기

08-1 RPubs로 데이터 분석 결과 공유하기

08-2 샤이니로 인터랙티브 웹 앱 만들기


혼공 시리즈의 특징은 직관적으로 알기 쉽게 목차 구성이 되어있고, 설명 또한 간결하다. 학습 로드맵과 구성이 알차서 로드맵대로 한다면 두달 정도면 한권을 책을 끝낼 수 있다. 비록 마스터 한다고는 할 수 없지만 최소 50~70% 이상은 이해할 수 있다. 여러 언어가 있지만 하나의 언어를 배우기 위한 첫짹으로 이정도 수준으로 학습이 가능하니 훌륭한 책과 강이 콘텐츠를 가지고 있다. 저자에게 질문을 하면 직접 답을 받을 수도 있어서 저자와 커뮤니케이션도 가능한 부분과 혼공 학습단과 같이 공부를 할 수 있는 것이 큰 장점 중 하나다.



학습 로드맵은 다음과 같다. 이론에 대한 부분, 실습에 대한 부분을 잘 알 수 있고 공부를 할때/진도를 점검할때 따라하기 좋다.


각 챕터별로 이론 설명과 쉬운 손코딩 그리고 확인문제와 소스 코드 정리 및 요약으로 구성되어져 있고, 코드도 복잡하지 않아서 따라하기 쉽니다. 이론만 듣다보면 지루할 수 있지만, 모든 챕터마다 실습이 같이 병행되기 때문에 학습 효과가 좋다.


첫 장은 빅데이터 개념과 초보자를 위해 R studio 설치 및 셋업부터 다루고 있다.


이론~~


실습!!


확인문제


마무리 및 요약


2월 22일 기준 코로나 확진자가 171,452명이다. 작년 초기에 몇백명, 천명 단위만 넘어갔어도 난리였는데, 오미크론 이후에는 만단위가 넘어가면서 20만을 앞두고 있으며 기하급수적으로 급증하고 있기에, 아래의 책의 공공 데이터를 통해서 간단하게 선벌진료소 위차와 빈도, 시각화를 할 수 있다.

 



아래 링크는 책의 저자가 강의해주는 유튜브이다.

https://www.youtube.com/watch?v=5ZyU0SigwZ8&list=PLVsNizTWUw7GlCcyc2E8LOvUJ-oR9Q_mJ



아래 브런치는 작년에 직접 코딩을 하면서 시각화를 해서 발행한 글이다.


https://brunch.co.kr/@bit-planner/83


                   "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다." 

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari