brunch

라이킷 30 댓글 5

You can make anything
by writing

by 괴짜분석가 Jul 04. 2019

데이터에 대한 얘기들

데이터는 발자취다

데이터는 신호와 소음이 같이 있다

데이터는 변한다

빅데이터는 실패하지 않게 하고, 스몰데이터는 성공하게 한다

빅데이터는 10대의 섹스와 같다. 모두가 얘기하지만 아무도 제대로 모른다

데이터 사이언스는 50% 과학, 50%는 아트다

평균만 보지 말고 분산도 봐라

쉬운 모델부터 써라

정확히 맞는 모델은 없지만, 확실히 틀린 모델은 있다

어느 회사도 데이터를 완벽하게 모으지 않았다. 경쟁사의 데이터가 없기 때문이다

데이터로 인사이트를 얻었으면 실험해 봐야 한다

변수를 설명하지 못한다면 빼라

우리는 더 나은 알고리즘을 가진 게 아니라 더 많은 데이터를 가졌을 뿐이다

엄청난 주장에는 엄청난 근거가 필요하다

사용 목적에 맞는 평가 방법을 고려할 필요가 있다

클릭 수는 '불쾌감'을 측정해주지 않는다

소속 집단에 대해 편견을 가지면 그 사람을 제대로 알 수 없다

어떠한 좋은 제어 테크닉도 좋은 디자인을 이길 수 없다

모델을 인문학적으로 설명하는 것은 처음에 모델과 친해질 때는 좋겠지만,
제대로 반영하지 않는다

나도 유클리디안 거리 쓴다

나도 아직 100% 이해한 건 아니다

일반인에게 normal은 평범하다는 뜻이지만,
통계학자에게 Normal은 아름답다는 뜻이고,
standard Normal은 미친 듯이 아름답다는 뜻이다.
마음에 드는 이성이 나타나면 "Normal하시네요"라고 말하자

킬러 로봇을 두려워하는 것은 화성에서 인구 과잉에 대해 걱정하는 것과 같다

삶에서 마주치는 일들을 분석하고 분석한 내용을 글로 적습니다. 작가명은 괴짜경제학(영제 Freakonomics)의 오마주입니다.

키워드 선택 0 / 3 0

댓글 쓰기 허용 afliean

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari

brunch

데이터에 대한 얘기들

데이터란 무엇일까요?

100% 과학이 아니기 때문에 이론이 중요한만큼 도메인에 대한 이해, 노가다, 설득과 타협, 선택과 개념 정의, 답이 없는 것에 대한 결단력 등도 중요하겠습니다.

데이터의 활용

아마도 "All models are wrong, but some are useful"이라는 문구를 응용하신 것 같습니다. 저 같은 초보가 만든 모델도 얼추 괜찮을 것 같지만, 이런 착각을 미연에 방지하는 팩트 폭행입니다.

무려 칼 세이건이 말해서 더 유명해진 격언입니다. 그래서 세이건 기준이라고 불립니다. 원문으로는 "Extraordinary Claims Require Extraordinary Evidence" 라고 하며 줄여서 ECREE라고도 합니다.

개인적으로 데이터분석은 배우고 활용하기 굉장히 쉽다고 생각합니다 (그래서 많은 분들이 데이터 역량을 기르려 하는 것이고). 하지만 동시에 엄청난 근거를 제시할 정도의 역량을 갖추기는 굉장히 어렵다고 생각합니다.

혹시 지금 엄청난 주장을 하려고 한다면 엄청난 근거부터 가져와 주세요.

제 첨언보다는 원글 자체가 좋으니 링크의 글을 참고해주시면 좋겠습니다. 평가방법, 종속변수 자체에 대해 고민하는 것도 중요하다는 내용입니다.

하지만 어떤 사람에 대해 궁금하다면, 얘기하고 싶다면 그저 그 사람에 대해 알아보는 방법밖에 없습니다.

기타

인문학적이라는 단어를 '비유적 표현', '쉽게 표현한 것' 정도의 의미로 사용하신 것 같습니다.

유머

농담이니까 따라 하지 마세요!

그 유명한 앤드류 응의 얘기입니다. 아주아주 먼 미래에는 가능할 수도 있는 일이지만 지금은 아무 의미 없는 논쟁이니 생산적인 얘기를 하자는 내용입니다.

*온라인을 통해 접한 분들의 경우 되도록 해당 글의 링크를 남겼으며, 오프라인으로 들은 내용은 별도로 출처를 적지 않았습니다.

* 제가 뭐 되는 사람이라 알려주는 게 아닌, 감명 깊게 들은 내용들을 공유하려는 의도로 만들었습니다.

* 제가 부족해 다른 글도 생각날 때 조금씩 수정하지만, 이 글의 경우 좋은 얘기를 듣는 대로 계속해서 업데이트하겠습니다.

* 분량 조절을 위해 이미 유명한 얘기들은 가져오지 않았습니다.