brunch

You can make anything
by writing

C.S.Lewis

by 양생이 Mar 13. 2022

스타트업이 데이터를 분석할 때 피해야 할 10가지

링크드인 데이터 과학자가 말하는 '데이터를 과학처럼 생각하기' 

데이터를 과학처럼 생각하기 

스타트업이 수집한 데이터를 분석할 때 피해야 할 10가지 함정 

모니카 로가티 Monica Rogati, 링크드인 데이터 과학자






1. 데이터에 결점이 없다고 가정하는 것

- 수집한 데이터가 유효하고 유용한 지 확인하라. 


2. 표준화하지 않는 것 

- 결혼식 장소로 인기 있는 도시의 목록을 만들고 있다고 가정해보자. 

- 결혼식에  참석하기 위해 어떤 도시로 비행기를 타고 온 사람들의 수를 센다면, 도시를 방문하는 전 항공 승객 수를 고려하지 않으면 그저 비행기를 이용하는 방문객 수가 많은 도시들의 목록이 될 수 있다. 


3. 열외의 사용자들을 배제하는 것 

- 하루에 천 번 이상 방문하는 사람들은 열혈팬일 수 있지만 콘텐츠만 수집해가는 검색 봇일 수 있다.


4. 열외의 사용자들을 포함시키는 것

- 데이터 기반 제품을 구축할 때는 이런 사용자들을 배제해야 한다. 그렇지 않으면 하드코어 팬들이 좋아하는 아이템을 모든 사람들에게 추천할 수 있다. 


5. 계절적 변동을 무시하는 것 

- 시간, 요일, 월에 따른 변화를 고려하지 않으면 잘못된 의사결정으로 이어진다. 


6. 성장을 평가할 때 전체 규모를 무시하는 것. 

- 정황 정보를 중요시하라. 

- 사업을 막 시작했을 때는 가족이 회원 가입만 해줘도 사용자 수가 두 배로 증가할 수 있다. 


7. 지나치게 많아 의미를 잃은 데이터 

- 대시보드에 데이터가 많아도 어떤 데이터를 봐야 할지 모르면 소용이 없다. 


8. 거짓 경보를 울리는 지표 

- 너무 경보가 자주 울리면 경보를 무시할 수 있다. 


9. 직접 수집한 데이터만 인정하는 배타적 태도 

- 우리의 데이터와 다른 곳에서 수집한 데이터를 합치면 매우 소중한 정보를 얻을 수 있다. 


10. 잡음에 초점을 두는 것. 

- 인간의 속성은 패턴이 없는데도 패턴을 발견하도록 되어 있다. 

- 허상 지표는 무시하고 한 발 물러서서 더 큰 그림을 볼줄 알아야 한다. 



출처 : 린 분석  

이미지 출처 : Dear Data




브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari