안녕하세요. 하트카운트 팀입니다.
이번에는 변수 간의 관계에 대한 이론을 다뤄 볼까 합니다.
사실 이 변수 간의 관계를 알고자 우리가 데이터를 분석하죠?
변수 간의 관계에는 선형 관계와 비선형 관계가 있습니다. 두 관계에 대한 정의와 상관관계에 대해 알아봅시다.
선형 관계란 이름 그래로 변수 간의 관계를 나타낸 개별 값들과 가장 오차가 나지 않는 선을 그었을 때 직선이 나타나는 경우입니다. 아래와 같이 말이죠. 이때 두 변수는 비례 혹은 반비례한다고 합니다.
식으로 표현한다면 [y= ax + b]로, 1차식이 나타납니다.
비선형 관계란 두 변수 간에 비례하는 관계가 아니며 직선으로 그 관계를 표현할 수 없는 관계입니다. 두 변수의 관계를 나타내는 기울기가 계속 변화하죠. 아래의 그래프는 물론 수많은 형태의 관계가 여기에 포함됩니다.
두 변수가 선형 관계에 있을 때만 상관관계라고 할 수 있습니다. 한 쪽 변량이 증가할 때, 다른 변량이 증가하거나 감소하는 관계이죠. 상관관계의 정도를 나타내는 수치가 바로 많이 들어보셨을 '상관계수'입니다.
데이터 분석의 결과를 보면 r이라는 문자를 보셨을 겁니다.
이 r이 바로 상관계수를 의미합니다. 상관계수의 범위는 -1에서 1까지로, 아래의 이미지에서 상관계수에 따른 변수 간의 관계를 알 수 있습니다.
하트카운트에서는 변수 간의 관계를 알 수 있는, 상관계수를 자동으로 계산하여 제공합니다.
더 자세한 설명이 보고싶으시다면 아래의 링크를 통해 블로그에서 확인 가능합니다 :)
- 블로그 포스트 링크: https://blog.naver.com/heartcount/222638913876
데이터 자동 분석 솔루션, 하트카운트에 대해 궁금하신가요?
지금 사용해보기
하트카운트 뉴스레터 구독하기는 여기를 클릭해주세요.
하트카운트 도입, 견적 및 구축 문의는 여기를 클릭해주세요.
(협업 문의는 support@idk2.co.kr로 부탁드립니다.)
하트카운트 데모 비디오는 여기를 클릭해주세요.
여기를 클릭하여 데이터 분석/시각화 커뮤니티 '데이터 히어로'에 참여하세요.