brunch

You can make anything
by writing

C.S.Lewis

by 루나 Mar 18. 2020

파이썬데이터분석의 절대지존 판다스의 아버지 웨스 매키니

[야만인] 인공지능 탄생의 뒷 이야기

이번 이야기에서 소개할 분은

데이터 분석도구에 중점을 둔

오픈소스 소프트웨어 개발자인

웨스 매키니 Wes McKinney 입니다.

그의 관심사는


사용자 생산성 향상

성능 및 효율성 향상

데이터 상호 운용성 향상


입니다.


그 목표로 만들어진 것이 판다스 pandas 입니다.

1985년 출생

1998~2001년 비디오게임 스피드런 TOP

2006년말 MIT 졸업(이론수학 전공)


이 때까지만 해도 웨스 매키니는 파이썬 Python 을 전혀 몰랐습니다.

대학에서 배운 것은 알고리즘 개론과 Java 초급코스 뿐이었습니다.

대학 졸업 후 2007년부터 ACQ Capital Management 사의 Front Quant Research 팀에서 근무했습니다.

그곳에는 많은 박사들이 SQL과 엑셀(스프레드 시트), 그리고 MATLAB으로 데이터를 정제, 분석하고 있었습니다.


그는 그것에 답답함을 느낍니다.

웨스 매키니는 좀 더 간결하고, 더 나은 방법을 찾기 시작했습니다.


그러던 중 동료 한 명이 그의 생각을 듣더니

뚝딱뚝딱 몇 가지 스크립트를 파이썬으로 작성합니다.


마치 대학시절 알고리즘을 표현한 의사코드와 비슷한 코드였습니다.

웨스 매키니는 그 코드에 매력을 느낍니다.

2008년 드디어 웨스 매키니는 파이썬의 세계에 들어옵니다.

그렇게 만난 것이 SciPy입니다.


그러나 본인은 금융회사에 근무 중이었고,

여전히 근무시간의 40% 이상을 SQL, 엑셀과 싸우고 있었습니다.

SciPy 논문을 보니 파이썬을 사용하여 NULL 값 및 누락된 데이터를 처리하는 방법도 있고,

상용 SAS(통계도구)를 대신하는 오픈소스도 많다는 사실을 알게 됩니다.


그러나 파이썬에는 그가 필요로 하는 통계도구가 없었습니다.


통계도구가 없어 파이썬을 쓰지 못하는 상황을 그는 이렇게 이야기합니다.

"닭이 먼저일까? 달걀이 먼저일까?"


다행히 웨스 매키니는 본인이 스스로 닭이 되기를 선택합니다.

그러다 스탠포드 대학 조나단 테일러 Jonathan Taylor 통계학 교수가 만든 패키지 안에서

본인이 찾던 모듈을 발견합니다.


그 코드를 파이썬으로 이식하려고 몰두 한 지 한 달 후에

판다스 초기버전이 세상에 나옵니다.

이 즈음 그는 잘 나가던 금융회사를 그만두고

Duke University에서 통계학 박사과정을 시작하는데

matplotlib의 존 헌터에 감명받고는 곧 휴학합니다.


그리고는 판다스 개발에 매진합니다.

이후 판다스 pandas 는 계속 발전하여

이제 Python으로 각종 통계계산을 작성하고, 레거시 시스템을 확장할 수 있게 됩니다.

2015년부터는 R Studio와 파트너쉽을 가진 Apache Arrow 프로젝트에 집중하고 있으며,

Python 및 R 용 데이터과학 도구에 중점을 둔 비영리 개발그룹 Usra Labs의 이사로 활동하고 있습니다.

그는 말합니다.


당신이 닭이 되어보세요.

컨설팅으로는 유용한 소프트웨어를 만들어낼 수 없습니다.

Python이 도와줄 거에요.

(출처)

https://wesmckinney.com/pages/about.html

https://speedrunwiki.com/Wes_McKinney

https://youtu.be/kHdkFyGCxiY

https://en.wikipedia.org/wiki/Wes_McKinney

https://en.wikipedia.org/wiki/Pandas_(software)


적송 권건우 redpine71@wedatalab.com
http://blog.naver.com/redpine71

공무원을 꿈꾸며 대학에 들어갔으나 동서양문화에 심취하여 수많은 사부님들을 찾아다녔고 기나긴 갈구끝에 서울 인사동과 중국 하남성 황토벌판 그리고 실리콘밸리에서 스승을 만났다. 지금은 산에서 내려와 많은 친구들과 동서문명을 융합시키는 새로운 도전의 여정에 있다.
前 삼성SDS technical architect
現 위데이터랩 대표이사
現 디랩아카데미 원장
現 성균관대, 한양대 겸임교수
現 세계진소왕태극권총회 서울분회장
#야만인 #동서양문화연구 #위데이터랩 #서예 #진소왕태극권

루나 허령
https://brunch.co.kr/@hvnpoet

컴퓨터과학과 소프트웨어공학을 전공하고, 지금은 금융회사의 상품과 서비스를 분석, 설계, 구현하는 일을 하고 있다. 대학 초년생 시절 마인드맵을 접한 이후 즐겁게 생각하는 방법을 깨달았고, 소프트웨어공학의 모델링 사상을 이해하고부터는 마인드맵과 모델링을 아우르는 마인드맵모델링을 연구 중이다. 세상에 대한 공학적인 접근 이외에도 마음공부와 서예, 태극권 등으로 자신과 세상의 경계를 넘어 진리를 탐구하고 있다.
#야만인 #마음공부 #마인드맵 #모델링 #서예 #진소왕태극권 #천상병


매거진의 이전글 파이썬으로 빅데이터 시각화의 문을 열다, 존 헌터
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari