brunch

매거진 AI for Good

라이킷 7 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by 제인 리 Dec 21. 2021

데이터는 왜?를 설명할 수 없다.

<The Book of Why> Judea Pearl (1)

<The Book of Why>의 저자 Judea Pearl은 책의 도입부에서 창세기 Genesis에 나오는 아담과 이브에 대한 이야기로 인과관계에 대해 설명하기 시작한다. 선악과를 먹은 아담과 이브에게 하느님은 그들이 선악과를 먹었는지 여부를 질문한다. 질문에 대해 아담과 이브는 "사탄이 그것을 먹으라고 했다"며 이유를 설명한다. 하나님은 그들에게 사실 fact, 즉 먹었는지 먹지 않았는지의 여부를 물어보았는데 이에 아담과 이브는 why 왜 먹었는지로 대답한다. 이 사건?을 통해 우리는 세 가지 사실을 알 수 있다.

세상은 딱딱한 사실만으로 이루어진 곳이 아니다. 사실 사실이라고 부를 수 있는 것들은 우리가 생각하는 것보다 훨씬 더 복잡한 인과관계에 의해 이루어져 있다

우리가 살고 있는 세상은 팩트(사과를 먹었다 안 먹었다) 보다는 인과적 설명 (사탄이 먹으라고 해서 먹었다)으로 이루어진 곳이다. 기계학습의 쟁점은 인과적 설명을 어떻게 하느냐에 달려있다.

우리의 데이터 프로세서에서의 전환은 점진적으로 일어나는 것이 아니다. 즉 우리는 데이터를 가지고 점진적으로 해석하여 인과관계를 만들어 내는 것이 아니다.

이 세 가지 사실로 하여금 쥬디아 펄은 하나의 결론을 도출했다. “No machine can derive explanations from raw data. It needs a push.” 어떤 기계도 데이터 만으로는 설명을 도출해 낼 수 없다. 즉 사실(데이터) 만으로는 어떤 현상이 왜 일어나는지 인과적 설명을 할 수 없다는 것이다. 현상이 보여주는 관계들에 대한 설명을 가능하지만 (A를 했을 때 B가 늘어났다와 같은) 왜 그런 현상이 일어났는지는 데이터만으로 설명이 불가능하다는 것이다. 그리고 지금까지의 기술로는 기계가 그 설명을 할 수 있는 수준이 아니라는 것이다.

다양한 지식과 경험을 통하여 인과관계를 추론할 수 있는 것은 기계가 아닌 사람이다. 그렇다면 사람은 어떻게 그 능력을 가질 수 있었을까? 이 대답에 대하여 저자는 유발 하라리가 사피언스에서 주장한 "Our ancestors’ capacity to imagine nonexistent things was the key to everything, for it allowed them to communicate better.” 즉, 우리 선조의 ‘상상하는 능력’ 덕분에 인간은 다른 동물 종에 비하여 엄청난 지능적 혁명을 겪을 수 있었다고 말한다. 이를 통하여 인간은 인과관계를 추론하는 능력을 가졌으며, "the connection between imagining and causal relations is almost self-evident" 상상하는 것과 인과 관계의 연관은 따로 설명할 필요가 없을 정도로 자명한 일일 뿐만 아니라 “it is useless to ask for the causes of things unless you can imagine their ocnsequenses” 어떤 일의 결과를 상상할 수 없다면 그 일의 원인이 무엇인지 묻는 것 자체가 쓸모없다고 말한다. 이 부분은 저자가 지속해서 설명하는 세 단계의 인과관계 사다리에서 더욱 자세하게 다룬다.

(2) 상상하는 것과 정신적 모델

저자는 Mental Model이라고 이름 붙인 정신적 모델이 상상력이 일어나는 영역이라고 설명한다. 이러한 모델을 국소적으로 변경하면서 다양한 시나리오를 실험할 수 있다고 말한다. “The mental model is the arena where imagination takes place. It enables us to experiment with different scenarios by making local alterations to the model.” 이를테면 한 사냥꾼이 사냥을 하는데 사냥 성공에 영향을 줄 수 있는 다양한 요인들을 상상한다고 가정해보자. 그런 상상에는 공격 방향, 맘모스의 사이즈, 날씨나 지형 등도 포함될 것이다. 이러한 다양한 요소를 상상하고 성공이라는 목적에 연관시키는 것이 저자가 말하는 일종의 정신적 모델이다. 이러한 모델은 사냥꾼 1이 사냥할 때의 성공률, 혹은 사냥꾼 2가 사냥할 때의 성공률 등과 같이 변수의 수를 변경하면서 성공 확률을 측정할 수 있다. 이렇게 하나의 모델을 만들고 모델 안에서의 환경을 바꾸어 가는 것이 바로 인과관계 모델의 중심적 형태이다. 머신러닝 역시 이러한 모델을 기반으로 만들어지고 있다.

(3) 지구에 혁명을 가지고 올 수 있었던 인간이 가지고 있는 세 단계의 인지적 능력

저자는 인과관계를 공부하는 사람들이라면 최소한 세 가지 분명히 다른 레벨의 인지적 능력 즉, 보는 것, 하는 것, 그리고 상상하는 것을 이해할 줄 알고 구분할 줄 알아야 한다고 말한다. 그는 이 세 가지 seeing, doing and imagining을 통하여 인과관계의 3단계를 차례로 설명했다.

Seeing: “seeing or observing, entails detection of regularities in our environment and is shared by many animals as well as early humans before the Cognitive Revolution” 보거나 관찰하는 것은 우리가 환경 속에서 어떤 규칙성을 발견하는 것을 수반할 뿐만 아니라 인지 혁명 (인간이 상상하기 시작한 순간 이후에 진행된 폭발적인 인지적 혁명) 이전에 살고 있던 많은 동물과 초기 인간들에게 나타나는 공통적인 특징이다.

Doing: “Doing entails predicting the the effects of deliberate alterations of the environment and choosing among these alterations to produce a desired outcome “ 어떤 행동을 하는 것은 환경을 우리가 의도적으로 변화시킴으로써 일어나는 영향을 예측하고 우리가 원하는 결과를 얻기 위해 변화할 수 있는 것들 중에서 원하는 변화를 선택하는 것을 의미한다. 일반적인 동물들과 인간을 행동에 있어서 구분할 수 있는 점은 우연히 혹은 그저 이전 세대에서 어떤 행동을 했기 때문에 그것을 따라 함으로써 얻어지는 게 아닌 의도적으로 그 행동을 하는 부분이 인간에게서 발견되기 때문이다.

Imagining: 어떤 의도적으로 선택된 행동을 할 수 있는 인간의 능력은 사실 상상하는 능력이 수반되었기 때문에 가능하다고 저자는 설명한다. “It was primarily this third level that prepared us for further revolutions in agriculture and science and led to a sudden and drastic change in our species’ impact on the planet” 이 세 번째 단계가 인간으로 하여금 농업과 과학에 있어서 엄청난 혁명을 이끌었을 뿐만 아니라 지구에 급격한 변화를 가져올 수 있게 했다.

이어지는 글: 딥러닝, 머신러닝은 여전히 연상화 단계에 머물러 있다

keyword

제인 리 소속 Giboo 직업 CEO

덕업일치의 어려움을 느끼면서 뉴욕에서 살고 있습니다

구독자 262

매거진의 이전글 딥러닝, 머신러닝은 여전히 연상화 단계에 머물러있다 의사에서 남자를 빼고 여자를 더하면 간호사? 매거진의 다음글

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari