링크드인 데이터 과학자가 말하는 '데이터를 과학처럼 생각하기'
스타트업이 수집한 데이터를 분석할 때 피해야 할 10가지 함정
모니카 로가티 Monica Rogati, 링크드인 데이터 과학자
- 수집한 데이터가 유효하고 유용한 지 확인하라.
- 결혼식 장소로 인기 있는 도시의 목록을 만들고 있다고 가정해보자.
- 결혼식에 참석하기 위해 어떤 도시로 비행기를 타고 온 사람들의 수를 센다면, 도시를 방문하는 전 항공 승객 수를 고려하지 않으면 그저 비행기를 이용하는 방문객 수가 많은 도시들의 목록이 될 수 있다.
- 하루에 천 번 이상 방문하는 사람들은 열혈팬일 수 있지만 콘텐츠만 수집해가는 검색 봇일 수 있다.
- 데이터 기반 제품을 구축할 때는 이런 사용자들을 배제해야 한다. 그렇지 않으면 하드코어 팬들이 좋아하는 아이템을 모든 사람들에게 추천할 수 있다.
- 시간, 요일, 월에 따른 변화를 고려하지 않으면 잘못된 의사결정으로 이어진다.
- 정황 정보를 중요시하라.
- 사업을 막 시작했을 때는 가족이 회원 가입만 해줘도 사용자 수가 두 배로 증가할 수 있다.
- 대시보드에 데이터가 많아도 어떤 데이터를 봐야 할지 모르면 소용이 없다.
- 너무 경보가 자주 울리면 경보를 무시할 수 있다.
- 우리의 데이터와 다른 곳에서 수집한 데이터를 합치면 매우 소중한 정보를 얻을 수 있다.
- 인간의 속성은 패턴이 없는데도 패턴을 발견하도록 되어 있다.
- 허상 지표는 무시하고 한 발 물러서서 더 큰 그림을 볼줄 알아야 한다.
출처 : 린 분석
이미지 출처 : Dear Data