1차 데이터, 극단값으로 인사이트 찾기
(=내부 데이터. 1차 데이터)
많은 디자이너들이 프로젝트를 시작할 때 2차 자료(이미 존재하는 통계나 연구)에 의존하곤 한다. . 당연히 내가 어떤 웹사이트/앱의 내부 데이터를 (사용자 데이터) 들여다볼 수 없으니 당연하다.
물론 설문, 인터뷰도 좋은 방법이지만, 여러 실 사용자의 행동을 직접 관찰하는 작업은 훨씬 더 강력한 인사이트를 제공할 수 있다.
이번에 내가 요리 레시피 웹사이트를 직접 구축한 이유도 바로 여기에 있다. 실제 사용자들이 사이트와 어떻게 상호작용하는지 직접 데이터를 수집하고 분석하여 더 깊은 인사이트를 얻고자 했다.
데이터 대시보드를 만들어 사용자 행동을 추적하던 중, 페이지 체류시간에 몇몇 '극단값'이 있다는 것을 발견했다.
Q. 극단값이란?
극단값은 데이터셋 평균에서 크게 벗어난 값들을 말한다. 단순히 '비정상적'이라는 의미가 아니라, 다른 데이터들과 현저히 차이가 나는 값이라고 생각하면 된다.
예를 들어, 대부분의 사용자가 레시피 페이지에 1~3분 정도 머무는데, 몇몇 사용자는 15분 이상 머무는 경우가 이에 해당한다.
Q. 극단값, 무조건 제외해야 할까?
극단값을 보면 이렇게 생각할 수도 있다.
"이상한 값이니 제외시키자"
하지만 UX/UI 디자인에서 극단값은 오히려 중요한 인사이트의 출발점이 될 수 있다.
왜 일부 사용자들은 페이지에 그렇게 오래 머물까?
특정 레시피에서만 이런 현상이 나타날까?
이 사용자들의 다른 행동 패턴은 어떨까?
이런 질문들이 오히려 사용자 경험 개선의 실마리가 될 수 있다.
Q. 극단값을 잘 보여주는 그래프(차트): 박스플롯(수염 박스)
극단값을 시각적으로 파악하기에 가장 좋은 도구는 박스플롯(Box Plot)이다. 이 그래프는 데이터의 분포와 함께 극단값이 어디에 위치하는지 한눈에 보여준다.
Q. 극단값인지 아닌지 구분하는 기준: IQR 활용하기
IQR (Interquartile Range) :
우리말로는 사분위 범위. 데이터가 얼마나 퍼져 있는지를 알려주는 '범위'의 한 종류. 극단값을 정의하는 가장 보편적인 방법이다.
위 이미지 보면 이해하기 쉬움.
데이터를 크기순으로 정렬
중앙값(Q2)을 기준으로 하위 25%(Q1)와 상위 75%(Q3) 지점을 찾음
IQR 값 계산하기: Q3 - Q1 (즉, 중간 50%의 범위)
일반적으로 (Q1 - 1.5×IQR) 미만이거나 (Q3 + 1.5×IQR) 초과인 값을 극단값으로 봄
데이터 분석은 UX/UI 디자이너에게 필수적인 스킬이 되었다. 특히 1차 데이터를 직접 수집하고 분석하는 능력은 여러분의 디자인 결정에 강력한 근거를 제공할 것이다.
취업 교육/기업 서비스 컨설팅 문의는 DM 또는 이메일로 연락주세요.