brunch

7강. 상관관계와 공분산

확률로 돈을 번다

by 골드펜

“함께 움직이는가”를 보는 법입니다.

투자에서 얼마나 오르내리느냐(변동성)만큼 중요한 게 무엇과 함께 움직이느냐(공동 움직임)입니다.

두 자산이 같은 방향으로 출렁이면 위험이 겹치고, 서로 다르게 움직이면 전체 위험이 줄어듭니다. 이 “함께 움직임”을 수치로 표현하는 도구가 공분산과 상관계수입니다.


미국의 등락에 따라서 코스피가 영향을 받는다면, 상관관계가 있습니다. 얼마나 밀접한지를 보는 법이 상관계수입니다.


1) 공분산(Covariance): “같이 오르내리나요?”


개념

두 변수 X, Y가 동시에 위·아래로 움직이는 경향을 나타내는 값.

해석

양수(+): 함께 오르거나 함께 내림(동행)

음수(-): 한쪽이 오르면 다른 쪽은 내림(역행)

0 근처: 뚜렷한 선형 관계가 없음


생활·시장 예시

아이스크림 판매량 ↔ 기온: 같이 증가 → 공분산 양수

금리 ↔ 채권가격: 반대로 움직임 → 공분산 음수


2) 상관계수(Correlation): “-1 ~ +1로 표준화해서 비교합니다”

공분산의 단점은 비교하는 대상의 단위가 다르면, 직관적인 비교가 힘듭니다. 앞선 Z점수처럼 값을 표준화하면 대상이 달라지더라도 비교가 쉽습니다.


개념

공분산을 각 변수의 표준편차로 나눠 정규화한 값.

범위: -1 ~ +1

+1: 완벽한 같은 방향

0: 선형 관계 거의 없음

-1: 완벽한 반대 방향


실생활의 사례

아파트 가격 ↔ 금리

금리가 내리면 시중의 유동성이 풍부해져서 아파트 가격이 오릅니다. 정부가 금리를 쉽게 내리지 못하는 이유가 됩니다. 반대로 금리가 오르면 대출 이자의 부담 때문에 수요가 줄어들어, 아파트 가격 상승의 억제 효과를 가져올수 있습니다. 물론 다른 여러 요인에 의해 상관관계는 달라질수도 있습니다.


미국 주식(예: S&P500) ↔ 한국 주식(KOSPI): 대체로 양(+)의 상관.
글로벌 경기 · 달러 유동성 · 리스크 온/오프의 공통 요인으로 같은 방향으로 움직이는 날이 많습니다. 특히 미국의 위기 때는 상관성이 더 높아지는 경향이 많습니다.


다만 상관 관계는 인과관계는 아닙니다. 같이 움직인다고 해서 한쪽이 다른 쪽의 원인인 건 아닙니다. 공통 요인·동시 반응일 가능성이 더 큽니다.


3) 포트폴리오에서 상관이 “매우” 중요한 이유

포트폴리오의 분산(변동성)은 단순 평균이 아닙니다. 아주 오래전 증권회사 광고에 '계란을 한 바구니에 담지 말자'라는 광고 문구가 있었습니다. 같은 변동성(σ)을 가진 두 자산이라도 상관(ρ)이 낮을수록 전체 변동성은 작아집니다.

ρ가 1이면 분산효과가 거의 없습니다. 예를들어 삼성전자와 하이닉스를 매수했다면, 상관관계가 1에 가까운 자산을 매수했으므로, 분산투자의 의미가 거의 없게 됩니다.

ρ가 0이면 서로 다른 흔들림이 일부 상쇄됩니다.

ρ가 음수이면 서로 반대로 움직여 리스크가 크게 줄어듭니다. 가장 이상적 조합입니다. 같은 기대수익(평균)이라면 상관이 낮은 자산을 섞을수록 효율적입니다. 이게 바로 마코위츠 포트폴리오 이론의 핵심 직관이자, 분산투자의 실질적 힘입니다.

다만 분산투자을 한다고 무조껀 좋은게 아니라, 기대수익이 플러스인 자산 중에서 분산투자를 해야 합니다.


4) 페어 트레이딩

분산투자 대신 상관성이 높은 자산을 투자에 이용할수도 있습니다. 상관이 높은 두 자산은 장기적으로 비슷하게 움직인다는 경험적 전제하에, 단기적으로 괴리(스프레드)가 벌어지면, 평균회귀를 기대한 포지션으로 차익을 노립니다. 고평가된 자산을 매도하고, 저평가 된 자산을 매수합니다.

삼성전자와 하이닉스의 상관계수가 1에 가깝다면, 많이 오른 하이닉스를 매도하고, 적게 오른 삼성전자를 매수하면 됩니다.

이렇게 하면 돈 벌기가 정말 쉬울것 같은데, 상관계수는 계속 변하기 때문에 스프레드가 더 커져서 큰 손실을 입을수 있습니다.


5) 엑셀 실습

이제 실제로 두 자산이 함께 움직이는 정도를 엑셀로 직접 계산해 봅시다.
엑셀에는 공분산과 상관계수를 계산하는 함수가 준비되어 있습니다.


(1) 수익률 데이터 만들기

가격만으로는 움직임의 크기가 달라서 '수익률'를 계산합니다.


예) =B2/B1-1

아래로 쭉 복사하면 일자별 수익률이 완성됩니다. 자산별로 계산해 둡니다.


(2) 공분산 구하기

공분산은 함수 'COVARIANCE.S'를 사용합니다.


예1)

A (온도) B (아이스크림 판매량)

1 20 100

2 25 130

3 30 150

4 35 170

=COVARIANCE.S(A1:A4, B1:B4)


결과값이 83.3으로 양수이며, 온도와 아이스크림 판매량은 상관 관계가 높다고 볼수 있습니다.


예 2)

코스피200와 코스닥150 선물지수로 비교를 해보겠습니다.


KakaoTalk_20251112_145903087.png


공분산 결과는 0.00017

양수가 나왔습니다.

하지만 이 값으로 상관관계를 직관적으로 알기가 힘듭니다.


(3) 상관계수 구하기

상관계수는 공분산을 −1~+1 사이로 표준화한 값입니다.
즉, 단위와 크기(%) 차이를 없애 비교하기 쉽게 만든 수치입니다.


위의 코스피200과 코스닥150 선물지수의 상관계수를 구해보겠습니다.


KakaoTalk_20251112_151002239.png


결과는 0.682로 꽤 높은 상관관계를 보였습니다.

이처럼 상관계수를 구하면 직관적으로 수치를 해석할수 있습니다.


이 결과로 실전에 바로 응용해도 될까요? 또 하나의 문제가 있습니다. 과연 상관관계는 늘 비슷하게 나올까?


(5) 롤링 상관(시간에 따라 변하는 상관)

시장의 상관은 고정되어 있지 않습니다. 위기 때는 평소보다 훨씬 동조화되어(=같이 움직여서) 분산효과가 줄어듭니다. 이를 ‘롤링 상관’이라고 합니다.


KakaoTalk_20251112_151829378.png


이처럼 전체가 아니라 일정 구간의 상관계수를 지정해서 아래로 복사해 줍니다.

60일과 200일로 구분해서 계산해 보겠습니다.


KakaoTalk_20251112_151838419.png


여전히 양수이지만, 상관관계는 일정하지 않음을 알수 있습니다.



핵심 정리

상관은 인과가 아니다.

상관은 변한다.

상관은 선형만 포착하므로, 꼬리구간에서는 관계가 달라질수 있다.


“무엇을 얼마나 사느냐”보다는 “어떤 것과 함께 사느냐”가 리스크를 바꾼다.

keyword
목요일 연재
이전 09화6-2강. 표준화와 Z점수(Z-score)