brunch

전체와 부분이 항상 일치할까?

심슨 패러독스의 이해

by 김응석

올해 프로야구는 LG의 통합 우승으로 마무리되었다. 2년 전의 감동과는 또 다른 느낌이었다.

야구는 "투수 놀음"이라고 하지만, 점수가 나야 이기는 경기타자들의 역량 또한 중요하다고 생각하다.

여기 A, B 두 명의 타자가 있다. A의 타율을 3할(0.300), B의 타율은 3할 5푼(0.350)이라고 한다면 어떤 판단을 할까? 당연히 B선수가 A선수보다 더 잘 친다고 생각할 것이다.

과연 그럴까?

심슨1.jpg

타자는 동일한 유형의 투수만을 상대하지는 않는다. 투수를 대표적으로 구분한다면 우완투수와 좌완투수로 구분할 수 있다. A, B 두 선수의 타율을 우완 투수와 좌완 투수로 구분해서 살펴보았을 때 다음과 같은 결과가 나왔다면 어떻게 해야 할까?

- 좌완 투수 타율 비교

심슨22.png

- 우완 투수 타율 비교


전체적으로 보면 B선수의 타율이 좋지만, 좌완 투수일 경우에는 오히려 A선수의 타율이 좋다. 이렇듯 전체 상황과 부분의 상황이 상반되는 결과가 나오는 것을 심슨(Simpson) 패러독스라고 한다.

왜 이런 현상이 발생할까?

여기서 타율은 단순 평균이 아니라 가중 평균이기 때문이다. 가중 평균? 왜 그럴까?

예를 들어서 쉬운 시험(어려운 문제 비중 10%)에서 100점을 받았고, 어려운 시험(어려운 문제 비중 90%)에서 60점을 받았을 경우 평균 점수는 (100 + 60) / 2 = 80점이 된다. 이를 단순 평균이라고 한다. 단순 평균은 시험의 난이도를 반영하지 못하는 단점이 있다.

따라서, 난이도를 반영한다면 (100점 X 0.1) + (60점 X 0.9) = 64점이라는 평균을 계산할 수 있다. 이렇듯 가중치를 반영한 평균을 가중 평균이라고 한다.


야구 타율로 본다면 어떻게 되는 것일까?

타자는 다양한 투수를 상대해야 한다. 타수가 많다는 것은 어려운 투수, 쉬운 투수 등 다양한 투수를 상대했다는 뜻이 된다. 따라서 전체 타율은 타수별 난이도를 고려한 가중 평균이 된다. 따라서, 우완 투수, 좌완 투수 대상 비중이 다르다면 개별 결과와 전체 결과가 다르게 나타난다.


결론적으로 타율은 상대 투수 타입, 경기 상황, 구장 등 '조건별 성적'이 전체 성적과 다른 모습을 보일 수 있으며, 이런 상황이 발생되었을 때 "심슨의 패러독스"가 발생했다고 한다.


그러면 어떻게 해야 심슨 패러독스에 빠지지 않을 수 있을까?

1) 전체 데이터와 부분(층별) 데이터를 반드시 동시에 확인해야 한다.

전체 평균만 보지 말고, 성별, 연령, 지역, 난이도, 시간대 등의 구분을 반드시 실시한다.

2) 샘플 크기(가중치) 차이를 확인해야 한다.

샘플의 크기가 서로 비슷한가를 확인한다.

3) 비교할 때 '동일한 조건'인지 확인해야 한다.

비슷해 보이더라고 조건이 다르면 전체와 부분의 방향이 달라진다.

4) 숨겨진 변수를 의심해 본다.

A, B를 비교할 때 혹시 숨겨진 제3의 요인(C)이 있는지 여부를 의심해 본다.

위 타율의 경우, 두 선수의 나이, 프로 야구 경력 등이 의심해 볼 수 있는 숨은 변수가 될 수 있다.

5) 다양한 지표를 활용한다.

단순 평균만이 아니라 표준편차, 분포 등 여러 개의 지표를 활용해서 종합적으로 판단한다.


심슨4.png

* 미국 유명 만화 영화인 심슨과는 아무런 관계가 없어요...

keyword
작가의 이전글F(X)의 힘과 Error의 힘