상관관계와 인과관계를 구분하시나요?

by 루케테

우리는 상관관계와 인과관계를 크게 구분하며 사용하고 있지 않다. 보통 상관관계에 불과한 내용을 인과관계가 적용된다고 간주하면서 말하는 경우가 많다. 하지만, 명백히 다른 개념이다.


A와 B 사이에 인과관계가 아닌 상관관계가 있다고 하자. A, B 동시에 인과관계에 있는 C라는 요인 때문에 C가 변화하면서 A와 B도 같은 경향성을 가지고 변화할 가능성이 높다. 이런 경우에는 A라는 요인을 제거한다고 하여도 B가 영향을 받지 않는다. 하지만, 이와 같은 접근법이 아주 무용한 것은 아니다. 왜냐하면, A라는 요인을 제거하기 위해서 우연히 C라는 요인을 건드리게 되어 B라는 요인도 제거가 될 수도 있기 때문이다. 이것은 운이 좋아서 얻어걸린 것이다. 하지만, 이런 접근법 만으로 문제를 해결하는 건 매우 비효율적이다. 언제나 운이 좋을 수는 없다.




상관관계는 통계를 통해서 적당히 유추해 볼 수 있지만, 인과관계는 명확히 밝혀내는 게 너무나 힘들다. 세상의 이치를 파악하고, 수많은 실험을 거쳐야 겨우 하나 발견할 수 있을까 말까이다.


만약에 건물 붕괴사고가 일어났다고 하자. 사람들은 건물 붕괴사고의 원인을 찾기 위해서 다방면으로 조사하게 된다. 규격에 맞지 않는 철골, 빗물이 섞인 콘크리트 타공, 관리 소홀 등등 복합적인 요인을 찾아낸다. 하지만 이는 모두 상관관계에 있는 요인이다. 인과관계는 각각의 요인들이 어떠한 영향을 주고받았는지, 서로의 관계를 파악하는 방법이다. 규격에 맞지 않는 철골이 건물 지지력에 어떻게 영향을 주었고, 어떤 한계를 넘어감에 따라 붕괴까지 이뤄졌다는 정도로 분석되어야 한다. 하지만, 쉽지 않다.


상관관계는 요인, 요인마다 모두 별개로 존재하고, 요인과 결론도 별개로 존재하는 것이며, 요인이 결과에 어느 정도 영향을 미친다는 것이며, 이는 확률의 영역이지 필연의 영역이 아니다. 즉, 똑같은 요인이 있다고 하여도 어떤 것은 붕괴할 수 있지만, 꼭 모든 것이 다 붕괴하지는 않는 것이 된다. 상관관계 분석에만 그치게 되면, 심하게 얘기할 때 붕괴사고는 운이 안 좋아서 발생한 것이라는 생각을 하게 만들기도 한다.


하지만, 인과관계는 요인과 결과의 연결을 분석하는 것이다. 즉, 인과는 연결인 것이고, 그리고 흐름이라는 시간적인 개념도 들어간다. 그리고 이것은 필연적인 영역임에 따라 확률이 작용하는 영역이 아니며, 인과성을 명확하게 분석해 낸다면, 붕괴사고 등에 따른 책임소재도 명확하게 정의할 수 있으며, 인과에 따른 연결성을 끊어내기만 하면 되니, 매우 적은 노력으로 문제 발생 소지를 미연에 방지할 수 있게 되기도 한다.




인과성을 파악하는 것은 너무나 어렵다. 어떤 것을 구성하는 요인이 한두 가지가 아닌데, 각각 요인마다 연결되어 있는 구조를 모두 파악하려고 하니, 인간의 영역에서는 거의 불가능하며, 현재의 슈퍼컴퓨터를 동원한다고 하여도 명확히 파악할 수는 없을 것이며, 그리고 인과관계에 있는 각각의 요인을 파악하는 것도 쉽지 않다. 그럼에도 불구하고, 불가능한 것은 아니다. 현재의 과학의 발달 정도를 보면 인과관계를 명확히 파악하는 것이 어려운 것은 아닌 것으로 보인다. 각종 물리엔진을 이용하고, 구성요소를 아주 세부적으로 프로그램에 입력을 하고 고도의 인공지능으로 그것이 붕괴까지 이르는 연계를 분석해 낼 수 있게 되면, 명확한 인과관계를 알 수 있을 것으로 보인다.




사람을 파악할 때도 그렇다.


우리는 인과관계에 따라 사람을 파악하지 않고, 상관관계에 따라 사람을 파악한다. 어느 지역 출신이면 이렇고, 혈액형이 이것이라면 이렇고, MBTI 가 무엇이면 이렇고, 사주구성이 이런 식으로 되어 있으면 이렇고 하는 것들은 모두 상관관계의 영역이지 인과관계의 영역이 아니다. 그리하여 확률의 개념으로 접근하게 된다. 이러이러하면 이런 특성을 보일 확률이 높다고 말하는 것이 현재 사람을 분석하는 기본적인 방식인데, 어떤 사람들은 그것을 상관관계가 아닌 인과관계로 받아들여, 이러이러하면 필연적으로 이러이러한 특성을 보일 것이야 라고 생각하기도 한다. 그렇지만, 확률이 영역이기에 그렇지 않은 경우도 있다는 것을 반드시 염두에 두고 사람을 파악해 나가야 한다.



커넥톰 연구의 선구적인 위치에 있는 승현준 박사의 책에서도 상관관계가 아닌 인과관계를 중요시하는 견해가 나온다. 현재 인간의 유전서열을 모두 파악하는 게놈 프로젝트는 완성이 되어서 많지 않은 돈을 지불하고 나의 유전자 염기서열이 어떻게 되어 있는지 파악할 수 있으나, 이것은 상관관계의 영역이다. 이러한 서열로 되어 있으면, 어떤 암이 걸릴 확률이 몇 % 이다라는 결론이 나온다. 앤젤리나 졸리가 염기서열을 알게 된 이후 유방암 걸릴 확률이 높다고 하여 유방을 절제한 것도 이러한 상관관계에서 접근한 방식이다. 하지만, 승현준 박사가 연구하는 커넥톰은 염기서열 간의 연결을 파악하여 어떤 현상이 발생하는 명확한 인과관계를 파악하려고 노력하는 것이다. 만약에 앤젤리나 졸리가 염기서열끼리 어떤 연결을 통해서 유방암이라는 결과를 가져올 것이라고 명확하게 알 수만 있었다면, 그 연결을 끊거나 다른 연결을 만들어내면 되지 유방을 절제까지 하지 않아도 되었을 텐데 말이다.



인과관계는 필연의 영역이기 때문에 정확하게 파악만 할 수 있다면, 대책을 마련하는 것은 매우 간단해질 수 있다. 인간의 커넥톰을 정확히 파악하기 위해서는 상상을 초월하는 용량의 저장장치가 필요하고, 또한 이를 빠르게 연산할 수 있는 기술도 필요하다. 승현준 박사의 책에서는 이러한 저장장치와 기술이 나올 수 있는 시점이 2100년이라고 해서 우리가 생전에 볼 수는 없겠지만, 이를 파악하기 위해 끊임없이 노력하는 것은 매우 의미 있는 일이라고 생각한다.




인간과 관련하여서만 이겠는가? 사회문제도 이와 같다.


저출산 현상과 육아 여건 저하는 인과관계가 아니라 상관관계일 가능성이 높다. 즉, 육아 여건이 저하되어서 저출산 현상이 일어난 게 아니라. 어떤 다른 요인 하나가 저출산 현상과 육아 여건 저하를 동시에 발생시키고 있는 것일 수도 있다. 그렇기에, 육아 여건 저하를 개선하려는 노력이 저출산 개선으로 이어지지 않게 되는 것일 수도 있다. 저출산 현상과 육아 여건 저하에 미치는 공통적인 요인을 바꾸지 않는 한, 저출산 대책 일환으로 육아 여건 개선에 들이는 돈은 모두 무용지물이 될 수도 있다.


이와 같이 우리는 상관관계에서 단계에서만 문제를 파악하려고 하지 말고, 세상의 이치를 파악하려고 하는 넓은 사고를 바탕으로 한 끊임없는 연구와 노력으로 인과관계까지 파악하기 위해 노력해야 할 것이다. 그것이야 말로, 우리가 처해 있는 각종 문제를 해결할 수 있는 유일한 수단이 될 것이다.


keyword
이전 05화시간을 효율적으로 사용하는 방법