통계적 삼단논증

Jul 14. 2020

올해 상반기(1∼6월) 서울 아파트 청약 경쟁률이 20년 만에 최고치를 기록했다. 다음 달 민간택지 분양가상한제가 시행되면 앞으로 서울 지역 추가 공급이 어려워질 것이라는 우려에…

https://www.donga.com/news/Economy/article/all/20200615/101523506/1

나름 열심히 저축했지만 우린 안 될거야…

2020년 상반기 서울 아파트 청약을 신청한 사람이 당첨될 확률은 1.01%다.
A는 2020년 상반기 서울 아파트 청약을 신청했다.
∴ A는 당첨되지 않을 것이다.

F의 x%는 G다.
a는 F다.
∴ a는 G가 아니다 (혹은 G다)

F의 x%는 G다

F는 대부분 G다
거의 모든 F는 G다
F 중 상당수가 G다
F가 G일 확률이 높다

시한부 선고를 받은 사람은 1년 내 사망할 확률이 90% 이상이다.
데이비드는 시한부 선고를 받았다.
∴ 데이비드는 1년 내 사망할 것이다.

35세 미국인 남성이 1년 내 사망할 확률은 10% 이하다.
데이비드는 35세 미국인 남성이다.
∴ 데이비드는 1년 내 사망하지 않을 것이다.

F의 x%는 G다.
a는 F다.
∴ a는 G다.

귀납 논리 #1 | 귀납 논증은 (연역 논증과 달리) 올바르다 하더라도 전제의 참으로써 결론의 참을 100% 보증하지 않습니다. 전제가 모두 참이더라도 결론이 거짓일 가능성은 열려 있죠. 그저 결론��

https://brunch.co.kr/@texto/74

1번 복권도 낙첨이다.
2번 복권도 낙첨이다.
3번 복권도 낙첨이다.
…
538번 복권도 낙첨이다.
∴ 앞으로 사게 될 복권도 모두 낙첨일 것이다.

희박한 확률보다 실제 당첨번호 ‘통계’로 본 로또‘8,145,060 분의 1’. 로또복권 1등에 당첨될 확률이다. 45개의 숫자 중 순서에 상관없이 뽑힌 6개의 숫자를 맞힐 산술적 확률로, 이제는 로또를

https://mnews.joins.com/article/8127432

귀납 논리 #5 | 통계적 삼단 논증을 제대로 평가하려면 확률에 대한 기본적인 지식이 필요합니다. 논증이 친절하게도 빨간 공 5개와 파란 공 3개가 든 주머니에서 임의로 꺼낸 공 3개가 모두 파란

https://brunch.co.kr/@texto/95

귀납 논리 #6 | 특정 사건이 발생하는 경우의 수와 가능한 모든 경우의 수를 통해서 그 사건이 발생할 확률을 구할 수 있다면 이제 여러 확률을 두고서 계산하는 법도 알아보시죠. 여러 사건 중

https://brunch.co.kr/@texto/97

디지털 광고 컨설턴트로 일하고 있어요.

통계적 삼단논증

그래서 사람들은 이렇게 얘기합니다.

어떤가요? 슬프지만 그럴듯하죠? 실제로 이 논증은 상당히 올바릅니다. 당첨 확률이 1%를 겨우 넘는 수준인데 당첨을 기대하지 않는 게 합당하겠죠 :-(

물론 그럼에도 불구하고 당첨 확률이 0은 아니기 때문에 결론이 거짓일 가능성은 여전히 존재합니다. A가 당첨될 수도 있는 일이잖아요?

올바름에도 불구하고 결론이 거짓일 수 있다? 그렇기 때문에 이 논증은 귀납적이라고 볼 수 있겠습니다.

이 논증은

와 같은 형식을 갖습니다.

이런 논증을 통계적 삼단논증statistical syllogism이라 불러요.

통계적 삼단논증의 강약

물론 여기서 "올바르다" 혹은 "그르다"는 개념은 모호하기 때문에 그 기준을 50으로 두는 데에는 이견이 있을 수도 있겠습니다.

아, 그 명칭에 "통계"가 등장하니 반드시 수치가 등장해야 할 것 같지만 꼭 그렇지는 않습니다.

대신

를 넣어도 괜찮아요. 그저 그 올바름의 정도를 정확히 비교하기가 어려워질 뿐이죠.

A는 아마 당첨되지 않을 거야

그렇습니다. 2020년 상반기 서울 아파트 청약 당첨률이 1.01%이니까, 그 청약을 신청한 A는 아마probably 당첨되지 않을 겁니다. 결코necessarily 당첨되지 않을 거라고 생각하면 곤란하겠죠? 이건 귀납 추론이니까요.

이 지점에서 주의할 게 있습니다.

2020년 상반기 서울 아파트 청약을 신청한 사람이 당첨될 확률은 1.01%다.A는 2020년 상반기 서울 아파트 청약을 신청했다.∴ A는 아마 당첨되지 않을 것이다.

과연 이 논증은 귀납 논증일까요? 아니면 연역 논증일까요

연역 논증입니다.

시한부 선고를 받은 35세 미국인 남성

시한부 선고라는 게 의학적으로 정의된 것인지는 사실 잘 모릅니다. 그냥 논의를 위해 1년 내 사망할 확률이 90% 이상인 경우에 시한부 선고를 받는다고 해볼게요.

그럼 이런 논증을 펼칠 수가 있을 겁니다.

이 논증은 올바른 듯 보입니다. 문제는

이 논증도 올바른 듯 보인다는 거죠.

이들 논증의 전제는 모두 참입니다. 그리고 둘 다 올바른 논증이죠. 그런데 두 가지 결론은 서로 충돌해요. 둘 중 하나는 거짓일 수밖에 없어요.

직관적으로는 첫 번째 논증이 더 좋은 논증인 것 같습니다. 그걸 어떻게 가려낼 수 있을까요?

때문에 우리는 첫 번째 논증을 보다 설득력 있는 논증이라고 여기게 됩니다.

두 번째 논증처럼 데이비드의 잔여 생존 기간에 관련된 정보(=데이비드가 시한부 선고를 받았다는 사실)를 생략하는 논증을 더러 불완전 증거 오류fallacy of incomplete evidence를 범했다고 말해요.

확률론이 필요해

통계적 삼단논증을 제대로 평가하기 위해서는 확률론을 익힐 필요가 있습니다.

이 논증의 올바름을 평가하는 일이야 x값만 주어지면 그만입니다. 전제를 참이라고 가정한 후에 결론도 참일 가능성이 높은지 혹은 낮은지만 보면 되니까요.

하지만 "F의 x%가 G"라는 전제의 진위를 따지고 싶다면 그 x%라는 수치가 어떻게 나온 것인지, 그리고 제대로 계산이 된 것이 맞는지 따질 필요가 있겠죠.

이 지점에서 귀납 논리는 수학, 조금 더 좁게는 통계학과 맞닿게 됩니다.

열거법을 다룬 글에서 로또를 538회에 걸쳐 샀지만 단 한 번도 1등에 당첨되지 않은 사례를 잠깐 언급했었는데요.

사례가 538개로써 꽤 많으니

이렇게 주장해도 되는 걸까요?

그래서 이 문제를 열거법으로 접근해서는 곤란할 것 같습니다. 추첨 번호가 이룰 수 있는 조합의 수(=대략 815만)를 고려해서 1등 당첨 확률은 먼저 구한 다음 미래에 사게 될 복권 당첨에 대해 썰을 풀어야 하겠죠.

이렇게 생각해볼 때 고작 538장의 낙첨 로또에 근거해서 미래에 긁게 될 복권에 대해 왈가왈부하는 건 충분하지 못한 사례에 근거한 그릇된 귀납 추론이라고도 볼 수 있겠군요!

2020년 상반기 서울 아파트 청약을 신청한 사람이 당첨될 확률은 1.01%다.
A는 2020년 상반기 서울 아파트 청약을 신청했다.
∴ A는 아마 당첨되지 않을 것이다.