brunch

You can make anything
by writing

C.S.Lewis

by gimmesilver Aug 23. 2017

데이터 분석가를 위한 추천 도서

  예전에 한 외부 강연 자리에서 어떤 분이 데이터 분석을 하는데 도움이 되는 책 하나를 추천해 달라는 질문을 했습니다. 그러나 나와 그 분의 배경이 다르고 취향이나 부족한 부분이 다르기 때문에 딱 한권을 추천하는 것은 실상 불가능하다고 생각합니다. 그래서 인터넷에 좋은 자료가 많이 있고 특히 코세라 같은 온라인 강의 사이트에 좋은 강의가 많이 있으니 그런 것들을 참고하면 좋겠다고 답변을 했습니다.

  그런데 한편 생각해 보니 요즘 데이터 분석이 많이 관심을 받고 있기 때문에 이미 많은 분들이 데이터 분석과 관련된 책 소개를 하는 것을 많이 접할 수 있습니다만 대부분 통계나 데이터 처리, 기계 학습 등의 분야에 대한 책에 치우쳐 있습니다. 그러나 데이터 분석을 하는데 있어 통계나 프로그래밍같은 기술적인 요소도 중요하지만 그에 못지 않게 논리적이고 과학적인 사고를 하는 것이 중요하다고 생각합니다. 그래서 여기서는 이런 직접적인 기술 관련 책 외에도 데이터 분석에 필요한 사고 혹은 자질을 갖추는데 도움이 될만한 책을 소개하겠습니다.


과학 철학 입문

    데이터 분석을 '데이터 과학'이라고도 많이 부릅니다. '데이터 과학'이 기존의 '데이터 분석'과 갖는 가장 큰 차이점으로 데이터 프로세싱을 위한 프로그래밍 여부를 꼽는 분들이 많은데 만약 그렇다면 '데이터 공학'이라고 부르는 것이 더 적합할 것입니다. '과학'이라는 용어가 갖는 의미는 프로그래밍과는 다를 뿐만 아니라 실상 데이터 분석이 갖춰야 할 다른 중요한 요소를 담고 있습니다. 

    이 책은 '과학'이란 무엇이고 '과학'이 갖춰야할 요건은 무엇인지 등 '과학'을 주제로 한 훌륭한 입문서입니다. 이 책에서 다루는 여러 가지 주제들은 좋은 데이터 분석가가 되려면 반드시 갖춰야 할 중요한 자질이라고 생각합니다.


과학적 추론의 이해

    '과학 철학 입문'이 개론서라면 이 책은 과학적 사고를 위해 필요한 사고력을 키우기 위한 구체적인 훈련서입니다. 대학 교재 목적으로 만든 책이라 내용이 딱딱하지만 데이터 분석에 필요한 사고력을 키우는데 이만한 책은 없다고 생각합니다. 


괴짜 경제학

    굉장히 유명한 책이기 때문에 이미 읽어 본 분들이 많으리라 생각합니다. 글 자체도 매우 재미있고 여러 가지 흥미로운 주제를 담고 있어서 앞서 소개한 두 책에 비해 훨씬 읽기 편합니다. 이 책은 데이터 분석을 위해 필요한 또 다른 중요한 자질인 문제를 적절하게 정의하는 방법에 대한 많은 힌트를 준다고 생각합니다.


How to measure anything

    데이터 분석을 위해 필요한 자질 중 또 중요한 것이 '분석 대상을 적절하게 측정(정량화)하는 법'입니다. 대개의 경우 우리가 분석하는 대상들은 엄밀하지 못하고 부정확하기 때문입니다. 책 내용 중 '우리가 무엇인가를 측정한다는 것은 불확실성을 감소시키는 것이다.' 라는 글이 나오는데 데이터 분석가라면 명심해야 할 문장이라고 생각합니다. 이 책은 어떤 대상의 불확실성을 줄이기 위해 어떻게 해야하는지에 대한 다양한 사례와 방법을 체계적으로 소개하고 있습니다. 


    마지막으로 책은 아니지만 소개하고픈 글이 있습니다. 인터넷에서 본 글(https://www.johndcook.com/blog/2012/09/06/how-long-can-you-think-about-a-problem/)인데 짧으니 여기에 전문을 인용하면 다음과 같습니다. 


How long can you think about a problem

    The main difficulty I’ve seen in tutoring math is that many students panic if they don’t see what to do within five seconds of reading a problem, maybe two seconds for some. A good high school math student may be able to stare at a problem for fifteen seconds without panicking. I suppose students have been trained implicitly to expect to see the next step immediately. Years of rote drill will do that to you.
    A good undergraduate math student can think about a problem for a few minutes before getting nervous. A grad student may be able to think about a problem for an hour at a time. Before Andrew Wiles proved Fermat’s Last Theorem, he thought about the problem for seven years.


당신은 얼마나 오랫동안 하나의 문제에 집중할 수 있습니까

    내가 수학을 가르치다 보면 겪는 가장 곤란한 점은 많은 수의 학생들이 어떤 문제를 보고 5초 이내에, 몇몇은 2초만에, 방법을 찾지 못하면 패닉에 빠지는 것이다. 우수한 고등학생들은 대략 15초 정도는 버티는 것 같다. 내 생각에 학생들은 다음에 할 것이 무엇인지 재깍재깍 제시되는 것에 암묵적으로 익숙해져 있는 것 같다. 여러 해 동안 반복된 단순 암기는 당신을 이렇게 만든다. 
    괜찮은 수학 전공 대학생이라면 대략 몇 분 정도는 버틸 수 있다. 대학원생이라면 그 시간이 1시간 정도는 될 것이다. '페르마의 마지막 정리'를 증명한 앤드류 와일즈는 (무려) 7년동안 그 문제에 대해 숙고했다. 


매거진의 이전글 통계 모델링과 기계 학습 모델링의 차이에 대한 단상
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari