brunch

You can make anything
by writing

C.S.Lewis

by 루나 Jan 27. 2020

통계 툴이었던 R을 빅데이터 툴로 발전시킨 해들리 위컴

[야만인] 인공지능 탄생의 뒷이야기

R을 배우게 되면 누구나 접하게 되는

시각화 패키지 ggplot2

전처리 패키지 dplyr

문자열처리 패키지 stringr 등

현재 R에서 빅데이터 분석을 위한 대부분의 툴을 만든 사람은

뉴질랜드 오클랜드 대학 출신의

해들리 위컴 Hadley Alexander Wickham 입니다.

뉴질랜드 오클랜드 대학 통계학 학사, 석사를 마치고,

2008년 아이오와 주립대학에서 통계학 박사학위를 취득했는데

박사학위 과정을 공부하면서 실제로 많은 데이터를 분석하다가

전처리를 위해 reshape을 만들었고,

시각화를 위해 ggplot을 만들었습니다.

그리고 이러한 경험을 모아서 박사학위 논문을 <<Practical tools for exploring data and models>>에 대해 씁니다.

이 논문이 바로 reshape, ggplot2, 분석모델 시각화를 위한 몇가지 패키지 개발에 대한 내용입니다.

2014년 tidy data라는 논문에서

데이터를 잘 분석하기 위해서는

데이터가 RDBMS나 엑셀처럼 행과 열의 형태로

잘 정리가 되어 있어야 함을 역설하였고,

tidy하게 데이터를 잘 분석하기 위해서

본인이 만든 패키지를 모으고, 추가 개발하여

tidyverse라는 데이터 분석용 패키지 시리즈를 발표합니다.

지금은 해들리 위컴이 만든 패키지가

빅데이터 분석툴 R에서

거의 표준이 되어가고 있는 상황입니다.


해들리 위컴의 ggplot2는

시각화 패키지의 왕좌를 차지하고 있는데

이것은 2005년도 리랜드 윌킨슨 Leland Wilkinson 의

<<The grammar of Graphics>>의 시각화 철학을 R패키지로 구현한 것입니다.

해들리 위컴이 구현한 ggplot2 패키지는

누가 보아도 최고의 시각화툴입니다.

Python에서는 plotnine library를 통해

R문법 그대로 사용할 수 있습니다.

ggplot2에는 수많은 extension과 d3.js, plotly.js 등

수많은 자바스크립트 계열의 시각화패키

쉽게 인터페이스하게 해줌으로써

기존 상용 시각화툴을 뛰어넘어

빅데이터 분야의 최고지위를 가지게 됩니다.


더구나 이 모든 기능을 무료로 공개하여

빅데이터 분석을 대중화하는데 크게 기여하였습니다.


그는 최근 4권의 책을 기술하였는데

모두 웹 상에서 무료로 공개하여

빅데이터를 공부하기 위한 많은 분들께

큰 도움을 주고 있습니다.

https://r4ds.had.co.nz

https://ggplot2-book.org

http://adv-r.had.co.nz

http://r-pkgs.had.com


현재는 R Studio의 최고 데이터 과학자로서 근무고 있으며,

오클랜드 대학, 스탠포드 대학, 라이스 대학의 겸임교수를 맡고 있습니다.

(출처)

Hadley Wickham - Wikipedia

https://en.m.wikipedia.org/wiki/Hadley_Wickham

Practical tools for exploring data and models
http://had.co.nz/thesis/practical-tools-hadley-wickham.pdf


Pivot table - Wikipedia
https://en.m.wikipedia.org/wiki/Pivot_table

Tidyverse
https://www.tidyverse.org/packages

Leland Wilkinson - Wikipedia
https://en.m.wikipedia.org/wiki/Leland_Wilkinso


적송 권건우 redpine71@wedatalab.com
http://blog.naver.com/redpine71

공무원을 꿈꾸며 대학에 들어갔으나 동서양문화에 심취하여 수많은 사부님들을 찾아다녔고 기나긴 갈구끝에 서울 인사동과 중국 하남성 황토벌판 그리고 실리콘밸리에서 스승을 만났다. 지금은 산에서 내려와 많은 친구들과 동서문명을 융합시키는 새로운 도전의 여정에 있다.
前 삼성SDS technical architect
現 위데이터랩 대표이사
現 디랩아카데미 원장
現 성균관대, 한양대 겸임교수
現 세계진소왕태극권총회 서울분회장
#야만인 #동서양문화연구 #위데이터랩 #서예 #진소왕태극권

루나 허령
https://brunch.co.kr/@hvnpoet

컴퓨터과학과 소프트웨어공학을 전공하고, 지금은 금융회사의 상품과 서비스를 분석, 설계, 구현하는 일을 하고 있다. 대학 초년생 시절 마인드맵을 접한 이후 즐겁게 생각하는 방법을 깨달았고, 소프트웨어공학의 모델링 사상을 이해하고부터는 마인드맵과 모델링을 아우르는 마인드맵모델링을 연구 중이다. 세상에 대한 공학적인 접근 이외에도 마음공부와 서예, 태극권 등으로 자신과 세상의 경계를 넘어 진리를 탐구하고 있다.
#야만인 #마음공부 #마인드맵 #모델링 #서예 #진소왕태극권 #천상병




매거진의 이전글 데이터 분석의 수퍼스타, R의 탄생
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari