brunch

You can make anything
by writing

C.S.Lewis

by HEARTCOUNT팀 Mar 18. 2022

데이터분석이론(3) 변수 간의 관계

안녕하세요. 하트카운트 팀입니다.

이번에는 변수 간의 관계에 대한 이론을 다뤄 볼까 합니다.


사실 이 변수 간의 관계를 알고자 우리가 데이터를 분석하죠?

변수 간의 관계에는 선형 관계와 비선형 관계가 있습니다. 두 관계에 대한 정의와 상관관계에 대해 알아봅시다.


1. 선형 관계

선형 관계란 이름 그래로 변수 간의 관계를 나타낸 개별 값들과 가장 오차가 나지 않는 선을 그었을 때 직선이 나타나는 경우입니다. 아래와 같이 말이죠. 이때 두 변수는 비례 혹은 반비례한다고 합니다.

식으로 표현한다면 [y= ax + b]로, 1차식이 나타납니다. 


2. 비선형 관계

비선형 관계란 두 변수 간에 비례하는 관계가 아니며 직선으로 그 관계를 표현할 수 없는 관계입니다. 두 변수의 관계를 나타내는 기울기가 계속 변화하죠. 아래의 그래프는 물론 수많은 형태의 관계가 여기에 포함됩니다.


3. 상관관계

두 변수가 선형 관계에 있을 때만 상관관계라고 할 수 있습니다. 한 쪽 변량이 증가할 때, 다른 변량이 증가하거나 감소하는 관계이죠. 상관관계의 정도를 나타내는 수치가 바로 많이 들어보셨을 '상관계수'입니다. 


데이터 분석의 결과를 보면 r이라는 문자를 보셨을 겁니다. 

이 r이 바로 상관계수를 의미합니다. 상관계수의 범위는 -1에서 1까지로, 아래의 이미지에서 상관계수에 따른 변수 간의 관계를 알 수 있습니다. 



하트카운트에서는 변수 간의 관계를 알 수 있는, 상관계수를 자동으로 계산하여 제공합니다.


더 자세한 설명이 보고싶으시다면 아래의 링크를 통해 블로그에서 확인 가능합니다 :)

- 블로그 포스트 링크: https://blog.naver.com/heartcount/222638913876



데이터 자동 분석 솔루션, 하트카운트에 대해 궁금하신가요?
지금 사용해보기


하트카운트 뉴스레터 구독하기는 여기를 클릭해주세요.

하트카운트 도입, 견적 및 구축 문의는 여기를 클릭해주세요.
(협업 문의는 support@idk2.co.kr로 부탁드립니다.)

하트카운트 데모 비디오는 여기를 클릭해주세요.

여기를 클릭하여 데이터 분석/시각화 커뮤니티 '데이터 히어로'에 참여하세요.


이전 03화 클라우드란 무엇인가
brunch book
$magazine.title

현재 글은 이 브런치북에
소속되어 있습니다.

작품 선택

키워드 선택 0 / 3 0

댓글여부

afliean
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari