brunch

You can make anything
by writing

C.S.Lewis

by 기획자 H May 13. 2024

산점도


산점도란?

데이터 간의 관계를 확인하고 싶을때 사용할 수 있는 시각화 그래프로서

두 변수 X,Y의 관계를 보여주는 자료 표시 방법입니다.

각 측정값은 두 변수를 의미하는 점으로 나타냅니다.




인사이트


산점도는 데이터 사이의 관계를 시각적으로 탐색하는 강력한 방법입니다.

적절히 활용한다면, 숨겨진 패턴, 이상치, 그리고 다양한 데이터 간의 상호 작용을 발견하여

중요한 비즈니스 인사이트를 얻을 수 있습니다.

아래에 몇 가지 주요 인사이트를 소개합니다.


    상관관계 파악

산점도를 통해 두 변수 사이의 상관관계를 빠르게 확인할 수 있습니다.

데이터 포인트들의 위치를 통해 양의 상관관계, 음의 상관관계 있음을 나타내며,

더하여 두 변수 사이에 상관관계가 없음도 알 수 있습니다.


이상치 발견

산점도는 이상치를 식별하는 데에도 유용합니다.

일정한 패턴을 따르는 데이터들 사이에 몇개의 포인트만 크게 벗어난 위치에 있다면,

그 포인트들은 이상치로 간주될 수 있습니다.

이상치는 데이터 수집 과정의 오류나 특별한 경우를 나타낼 수 있으며, 추가 분석이 필요한 영역을 지적해 줄 수 있습니다.


관계의 형태 파악

두 변수 간의 관계가 선형(linear)인지, 비선형(non-linear)인지를 산점도를 통해 확인할 수 있습니다.

비선형 관계가 존재한다면, 이는 단순 선형 회귀 모델보다 더 복잡한 모델을 고려해야 함을 의미할 수 있습니다.


집단 간 비교

산점도에 색상이나 기호를 달리하여 여러 집단의 데이터를 표시하여 집단 간 차이를 시각적으로 비교할 수 있습니다.

이는 특정 집단이 다른 집단과 비교하여 어떤 특징을 가지고 있는지 파악하는 데 도움을 줍니다.


    변수 간의 복잡한 관계 탐색

두 변수 사이에 직접적인 상관관계가 보이지 않더라도,

세 번째 변수를 고려함으로써 더 복잡한 관계를 발견할 수 있습니다.

예를 들어, 특정 변수를 조절 변수로 설정하고 산점도를 분석함으로써,

조절 변수에 따라 두 변수 간의 관계가 어떻게 변하는지 관찰할 수 있습니다.  

.



상관관계

산점도는 X축과 Y축에 각각 두 변수를 나타내고 데이터 포인트를 점으로 표시,

변수간의 상관 관계를 시각적으로 보여주는 시각화 기법입니다.


점들이 오른쪽 위로 상승 추세 → 양의 상관관계

두개의 지표 중 하나가 증가하면 다른 하나도 증가



점이 오른쪽 아래로 하강 추세 → 음의 상관관계

두개의 지표 중 하나가 증가하면 다른 하나는 감소



점의 배치에 패턴이 보이지 않음 → 상관관계 없음

데이터간의 상관관계가 없음



상관계수

두개의 변수사이의 직선적인 관련 정도를 측정하기 위한 통계량으로,

직선과 어느정도 가깝게 점들이 흩어져 있느냐 하는 선형관계의 강도를 나타냅니다.

0을 기준으로 1에 가까우면 양의 선형 상관 관계

0을 기준으로 -1에 가까우면 음의 선형 상관 관계

0이면 상관관계 없음



좌측의 그래프 2건 : 강한 상관 관계 / 우측의 그래프 2건 약한 상관 관계



산점도의 활용


추세선 추가 & 색상 구분

추세선 추가

데이터 분포에 존재하는 패턴을 빠르게 식별할 수 있습니다.

변수사이의 상관 관계를 쉽게 알아볼 수 있습니다.

데이터 포인트가 많을 때 유용합니다.


색상 구분

색상을 분리시켜 두 범주를 쉽게 식별 할 수 있습니다.


회귀선 추가 & 색상 구분



세번째 변수 추가

X축과 Y축으로 된 2개의 변수가 아닌 포인트 크기를 변경하여 세번째 변수를 데이터로 시각화 할 수 있습니다.

좌: 2개의 변수 / 우: 3개의 변수


집중된 스팟 분석

산점도에서 집중도가 높은 포인트의 분포를 확인할 수 있습니다.



인자를 나누어 분석

X축의 인자를 요일별로 나누어 표기


영역별로 그룹화하여 분석

영역별로 구분하여 식별하기 쉽게 만들었습니다.




마치며

기획자는 산점도를 활용하여 프로젝트 데이터 간의 상관관계를 파악하고

인사이트를 도출할 수 있어야 합니다.

이를 통해 복잡한 프로젝트 환경에서 변수 간 관계를 직관적으로 보여주어

기획자의 효과적인 의사결정을 내릴 수 있어야 하고

프로젝트 이해관계자들의 이해도를 높일 수 있도록 해야합니다.






작가의 이전글 PRD, PM의 소통법
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari