brunch

You can make anything
by writing

C.S.Lewis

by 지은 x NULL Nov 05. 2018

[책리뷰] 처음 시작하는 R 데이터 분석

나도 한번 데이터 분석에 발을 담가보자 - ★★★☆

일러두기

이전 브런치 글도 적었듯 R을 알고, 매일 R을 사용 중이며, R에 대해 계속 공부하고 있다. 어림잡아 이 책의 90%정도는 알던 내용이라고 봐도 될 듯싶다. 뿐만 아니라 시중에 나와있는 R 책들, 그중에서도 최근에 나온 책이라면 대부분 서점에서라도 거의 다 펼쳐봤다고 할 수 있을 정도로 사실상 이 책의 '대상 독자'는 아니라는 점을 일러둔다. 가능하다면 다른 책들도 시간이 나는대로 리뷰를 남겨볼 계획이다.




첫인상

'컴퓨터책'이라고 하기에는 굉장히 fancy하다. - 영어를 남발하고 싶지 않지만 업계의 용어라고 해두자.

All color인 데다가 기존 한빛미디어 책이랑은 뭔가 다르다는 느낌이 강한데, IT관련 서적같지는 않고 그렇다고 막 생소하지도 않았는데 생각해보니 학생들 문제집 같은 편집이다.

7일 완성 학습 로드맵이 있어서 더 그랬던 듯싶다.

위에서 두 번째 책. 책이 얇다. (인덱스 포함 328페이지)

전면에 내세우지는 않았지만 표지를 보면 Hello Coding 시리즈 즉 입문서이고, 제목에서도 알 수 있듯 '처음 시작하는' 'R(로 하는)' '데이터 분석'을 다루는 책이다.



본문

보통 어느 것 하나 버릴 게 없다!...고 하면 좋겠지만

안타깝게도 버릴 게 많다.

R이 뭔지 알고, R Studio를 이미 사용(설치)해본 독자라면 60페이지[3장]부터

엑셀이나 텍스트 파일을 읽어들이고 내용을 확인해 볼 수 있는 정도라면 97페이지[5장]부터

주요 패키지 이름들을 알고 데이터를 이것저것 다뤄봤다면 250페이지부터 시작하는 실전 프로젝트 부분을 보면 좋을 것이다.


요컨대 책 분량이 많지 않은데, 굉장히 기초적인 내용을 앞부분에 상세히 설명하고 있는 점이 아쉽다.

R에 대해 들어본 바 없고 제목 그대로 처음 시작하는 독자라도 1~4장은 처음 한 번 하루이틀에 걸쳐 읽어보면 충분할 것 같다.

본의 아니게 혹평했지만

이 점만 빼면 나머지는 다 좋다. 초심자에게.

"통계를 몰라도, 프로그래밍이 익숙하지 않아도, 빅데이터 시대에 누구나 할 수 있는 R 데이터 분석 입문"을 표방(뒷표지 曰)하고 있으니 주 독자층에 맞춰진 좋은 책이다.

비개발자라면 기초도 없이 매번 검색해보고 블로그를 찾아다니는 것보다 이러한 입문서를 학습로드맵에 맞춰 차근차근 따라하면 큰 도움이 될 것이라고 본다.

내용이 쉬우면서 많은 사람들에게 두루 읽힐 수 있는 책을 쓰고 싶은 사람으로서 저자의 노력에 박수를 보낸다.



장단점

추천하고 싶은 점

Part 3의 필수패키지와 함수 소개 및 예제는 꼭 필요한 내용들이고 설명하는 수준도 적당하다.

Part 4의 실전 프로젝트가 이 책에서 가장 좋은 부분이었다고 생각하는데, 책의 전반부에 알려주는 내용들로 과연 무엇을 어떻게 '써먹을' 수 있는가에 대한 궁금증을 해소시켜 줄 것이다.

데이터를 구하고, 불러서, 가공하고, 이런 것들을 할 수 있다라는 괜찮은 실례를 보여주는 부분이다.

아직 책을 구입하기 전인 독자라면 먼저 한번 후반부를 보고 흥미가 생긴다면 앞부터 차근차근 읽어보는 것을 추천한다.


아쉬운 점

편집이 독자층에 걸맞게 화려한(?) 것이 이 책의 장점 중 하나라고 생각하는데 그런 와중에 사소한 오탈자는 몹시 안타깝다.

금새와 He와 그대도

또한 뒤에 나올 내용을 참조하라거나 스타일이 다른 부분이 약간 보였는데 예를 들어 앞에서 dplyr 패키지의 bind_cols 함수를 설명하고 책 후반 실전 프로젝트에서는 base의 cbind를 사용하는 부분이 있다. *데이터 분석을 한다면 대다수 dplyr과 파이프(%>%)를 쓰겠지만 개인적인 의견으로는 cbind가 기본 패키지에 포함되어 있고 약간 용례가 다르다보니 둘다 알아두는 게 좋고, 굳이 순서를 따지자면 앞에 나오는 것이 적합하지 않을까. 초보자의 러닝 커브를 줄이기 위해 다양한 패키지를 알 필요가 없다고 생각했다면 둘 중 한 방법으로 통일하는 게 좋았을 것이다. 추측컨대 두 명의 공저자 중 각각 다른 사람이 집필한 건 아닐까 싶다.

오탈자와 구성을 차치한다면 바로 위에서 장점으로 꼽은 Part 4부분에 가장 아쉬운 점이 있다. 공공 데이터 등을 다운받아 오는 것까진 좋았는데 왜 엑셀을 열어서 데이터를 가공했을까. 데이터 분석에 있어 전처리는 무척 중요한 부분이고 R에 익숙해지면 엑셀 필터 기능보다 편리한 부분이 많은데 그 부분에 지면을 할애하지 않은 점이 참 아쉽다.



추천 독자

- '데이터 분석'을 해야 하는데 엄두가 안 나서 어디부터 시작해야 할지 감을 못잡는다면...

- R을 깊이 공부해볼 마음은 아직 없지만 코딩은 건너 뛰고 데이터 분석을 해보고 싶다면...

- 새로운 언어를 배울 때 R Studio와 같은 IDE도 하나씩 차근차근 알려주면 좋겠고 '올 컬러' 참고서/문제집이 익숙하다면...


※ 참고로 출판사에서 말하는 '어떤 독자를 위한 책인가?'는 다음과 같은데,

1. 빠르게 배워 실무에서 R 데이터 분석을 이용하려는 직장인

2. 경제, 경영, 통계학 등 데이터 분석이 잦은 학과 전공자

3. 데이터 분석에 입문하려는 컴공 전공자

2, 3번은 이미 하나 이상의 프로그래밍 언어나 통계 패키지를 사용하고 있을 테니 그런 점을 감안하면 '과하게' 친절해서 1번의 직장인(개발자가 아니다)에게 주로 추천하고 싶다.



한줄평 및 별점(대상독자 恨)


나도 한번 데이터 분석에 발을 담가보자 - ★★★☆


아니다 싶으면 빼고

맞다 싶으면 무릎에서 몸을 거쳐 머리까지.





리뷰어로 책을 제공받아서 읽고 적었습니다.

주관적인 감상을 객관적으로 쓰고자 했는데 모쪼록 도움이 되었으면 좋겠네요. (출판사에서는 좋아하지 않을지도 모르겠네요.)

신간이고 다른 리뷰도 많으니 더 자세한 내용은 출판사 홈페이지에서 확인해보시길 추천합니다.


-.null

매거진의 이전글 [뉴스 속 데이터분석] 국회 특수활동비

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari