데이터 간의 관계를 확인하고 싶을때 사용할 수 있는 시각화 그래프로서
두 변수 X,Y의 관계를 보여주는 자료 표시 방법입니다.
각 측정값은 두 변수를 의미하는 점으로 나타냅니다.
산점도는 데이터 사이의 관계를 시각적으로 탐색하는 강력한 방법입니다.
적절히 활용한다면, 숨겨진 패턴, 이상치, 그리고 다양한 데이터 간의 상호 작용을 발견하여
중요한 비즈니스 인사이트를 얻을 수 있습니다.
아래에 몇 가지 주요 인사이트를 소개합니다.
산점도를 통해 두 변수 사이의 상관관계를 빠르게 확인할 수 있습니다.
데이터 포인트들의 위치를 통해 양의 상관관계, 음의 상관관계 있음을 나타내며,
더하여 두 변수 사이에 상관관계가 없음도 알 수 있습니다.
산점도는 이상치를 식별하는 데에도 유용합니다.
일정한 패턴을 따르는 데이터들 사이에 몇개의 포인트만 크게 벗어난 위치에 있다면,
그 포인트들은 이상치로 간주될 수 있습니다.
이상치는 데이터 수집 과정의 오류나 특별한 경우를 나타낼 수 있으며, 추가 분석이 필요한 영역을 지적해 줄 수 있습니다.
산점도에 색상이나 기호를 달리하여 여러 집단의 데이터를 표시하여 집단 간 차이를 시각적으로 비교할 수 있습니다.
이는 특정 집단이 다른 집단과 비교하여 어떤 특징을 가지고 있는지 파악하는 데 도움을 줍니다.
두 변수 사이에 직접적인 상관관계가 보이지 않더라도,
세 번째 변수를 고려함으로써 더 복잡한 관계를 발견할 수 있습니다.
예를 들어, 특정 변수를 조절 변수로 설정하고 산점도를 분석함으로써,
조절 변수에 따라 두 변수 간의 관계가 어떻게 변하는지 관찰할 수 있습니다.
.
산점도는 X축과 Y축에 각각 두 변수를 나타내고 데이터 포인트를 점으로 표시,
변수간의 상관 관계를 시각적으로 보여주는 시각화 기법입니다.
두개의 지표 중 하나가 증가하면 다른 하나도 증가
두개의 지표 중 하나가 증가하면 다른 하나는 감소
데이터간의 상관관계가 없음
두개의 변수사이의 직선적인 관련 정도를 측정하기 위한 통계량으로,
직선과 어느정도 가깝게 점들이 흩어져 있느냐 하는 선형관계의 강도를 나타냅니다.
0을 기준으로 1에 가까우면 양의 선형 상관 관계
0을 기준으로 -1에 가까우면 음의 선형 상관 관계
0이면 상관관계 없음
추세선 추가
데이터 분포에 존재하는 패턴을 빠르게 식별할 수 있습니다.
변수사이의 상관 관계를 쉽게 알아볼 수 있습니다.
데이터 포인트가 많을 때 유용합니다.
색상 구분
색상을 분리시켜 두 범주를 쉽게 식별 할 수 있습니다.
회귀선 추가 & 색상 구분
X축과 Y축으로 된 2개의 변수가 아닌 포인트 크기를 변경하여 세번째 변수를 데이터로 시각화 할 수 있습니다.
산점도에서 집중도가 높은 포인트의 분포를 확인할 수 있습니다.
영역별로 구분하여 식별하기 쉽게 만들었습니다.
기획자는 산점도를 활용하여 프로젝트 데이터 간의 상관관계를 파악하고
인사이트를 도출할 수 있어야 합니다.
이를 통해 복잡한 프로젝트 환경에서 변수 간 관계를 직관적으로 보여주어
기획자의 효과적인 의사결정을 내릴 수 있어야 하고
프로젝트 이해관계자들의 이해도를 높일 수 있도록 해야합니다.