근본적인 한계에 대한 이야기
내가 할려고 하는 이야기에서 사용하는 언어는 수학이다. 누군가는 영어로 한국어로 자신의 이야기를 풀어가듯이, 나는 수학을 이용하여 내가 하고자 하는 이야기를 풀어 나가고자 한다.
집합과 명제는 대한민국에서 고등학교 수학을 했던 사람이면, 누구나 다루었던 그래서 누구나 쉽다고 생각하는, 그래서 지금은 교과과정에서 빠져도 상관이 없다고 생각되는 과정이다. 그렇지만, 집합과 명제는 수(Number)가 아닌 그냥 것들(Something)을 수학적으로 표현할 수 있는 가장 중요한 도구인 동시에, 누군가의 논리 객관적으로 판단 할 수 있는 가장 유용한 도구 이다.
그렇다고 여기서 집합론을 다룰려는 것은 아니고, 앞으로의 이야기를 풀어나가는데 있어서 제가 하고자 하는 이야기에 대한 객관적 논리를 증명하기 위해서 몇 가지만 정리를 하고 지나가도록 하겠다.
일반적인 삼단논법은 다음과 같다:
1: A는 B이다.
2: B는 C이다.
3: A는 C이다.
즉, 1번과 2번이 (절대적) 참(True)이면, 3번은 무조건(절대적) 참(True)이다. 예를 들자면,
1: 소크라테스는 사람이다.
2: 사람은 죽은다.
3: 소크라테스는 죽는다.
위의 논법을 (부분)집합으로 표현하면 다음과 같다:
A={x| 소크라테스}
B={y| 사람들}
C={z| 죽은것 혹은 죽을 것들}
그리고, 여기서부터는 집합론의 본질 (Basic rule)을 따른다는 것이다. 위의 집합을 이용하여, 삼단 논법을 표현하면:
즉, A가 B의 부분 집합(subset)이고, B가 C의 부분 집합이면, A는 C의 부분 집합이다. 그냥 말로 할때는 보는 관점에 따라 명제 값이 달라 질수 있지만, 수학이라는 규칙을 사용할 경우에는 이 명제의 값은 "절대적"이다. 이 절대적인 명제의 값이 바뀌는 경우는 "(기본) 규칙이 바뀌거나 다른" 경우 밖에 없다. 이 말은 규칙이 바뀌지 않는한 위의 명제[식(1)] 값는 "절대"적으로 옳다(True)는 의미이기도 하다. 그리고 중요한것 하나, 위의 명제의 역(Converse)은 절대적이지 않다는 거다.
다음과 같은 집합들 생각 해보자.
A={빅데이터(Bigdata)}
B={데이터사이언스(Data Sceinces)}
C={통계학(Statistics)}
D={수학(Mathematics)}
이론적은 혹은 학문적인 지식(Knowlegement)만을 고려한다고 했을때, 위의 집합에 대한 관계는 다음과 같다는 것을 의미한다:
그리고, 위의 집합은 각집합이 가지고 있는 본질적 한계들이 존재 한다. 즉, 통계학은 통계(학)이기 때문에 가지는 본질적인 한계들이 있고, 데이터과학은 데이터 과학이기 때문에 가지는 한계가 존재 한다는거다. 아이러니하게도 이러한 한계들이 그 집합을 정의한다. 그리고 중요한것, 위의 이유[식(2)]때문에 빅데이터(A)는 데이터과학(B)이 가지는 한계를 넘어 설수 없으며, 통계학(C)이 가지는 한계는 "절대로" 넘어 설수 없다는거다.