brunch

자동화된 추측 기계에 대한 경고

[논문 읽기: Artificial Intelligence … ]

by 무순

이 글은 아래 논문에 대한 독서 노트이다.

: Stark, L. (2023). Artificial intelligence and the conjectural sciences. BJHS Themes, 8, 35–49.


1.


<Artificial Intelligence and the Conjectural Sciences>는 BJHS(The British Journal for the History of Science) Themes 제8호에 실린 루크 스타크(Luke Stark)의 논문이다. 루크 스타크는 웨스턴대학교 정보미디어학교수단(Faculty of Information & Media Studies, FIMS) 조교수를 역임하고 있으며, 컴퓨터 기술의 윤리적, 역사적, 사회적 영향을 연구하고 있다. 발표한 논문으로는, “Breaking Up (with) AI Ethics”(2023), “Apologos: A Lightweight Design Method for Sociotechnical Inquiry”(2021), “The Emotive Politics of Digital Mood Tracking”(2020) 등이 있다.



2.


초록


통계학의 역사와 철학을 다룬 지난 연구에 의지해, 본 연구는 다음과 같이 주장한다. 많은 경우, 기계학습(ML)과 같이 AI 기법으로 작동하는 분석은 근본적으로 ‘추측적(conjectural)’이다. 또한, 사후적인 귀추 논리에 의존하는데, 현대 기계학습 시스템에서 이 논리는 종종 재생산할 수 있는 진실로 오해받는다. 여기에서 본 연구는 카를로 긴츠부르그(Carlo Ginzburg)가 역사 범주의 하나로서 ‘추측 과학’이라고 부른 것을 현재 기계학습의 인스턴스화(instatntiation) 및 ‘자동화된 추측’의 실행과 연관 짓는다. 본 연구는 인상학(physiognomic) 및 골상학(phrenological) 개념의 자동화가, 신뢰를 잃은 추측적 사이비과학이 오늘날 AI 연구에 의해 소생되고 있는 방식을 어떻게 모범적으로 보여주는지 설명한다. 마지막으로, 본 연구는 ‘추측’ 과학과 ‘경험’ 과학 간의 개념적 구분이 추론을 자동화하는 경향이 있는 시스템의 특정 분류를 개발하지 않아야 하는 개념적 정당화와 역사적 정당화를 제공함으로써 AI 시스템의 설계와 이용을 규제하기 위한 현재의 노력을 도울 수 있다고 주장한다.



3.


이 논문은 방대한 데이터에 기반을 둔 기계학습이 귀납 추론과 연역 추론의 간극을 없앨 수 있다는 AI 연구자들의 희망찬 약속에 대해 그것이 실제로는 가능하지 않음을 역설하고 있다. 이를 위해 스타크는 이탈리아 역사학자 카를로 긴츠부르그의 ‘두 과학의 구분: 추측 과학과 경험 과학’에 의지한다. 이 구분에 따르면, 두 과학은 모두 추측을 포함하지만, 추측 과학은 귀납에서 귀추법으로 나아가거나 귀추법에 의존하지만, 경험 과학은 규칙성과 복제가능성을 핵심으로 하여 추측을 통해 연역 가설로 나아가는 특징을 갖는다. 두 과학은 어느 정도 한계를 갖는데, 추측 과학의 경우 과학적 불확실성이 굉장히 높다는 점이며, 경험 과학은 아무리 노력하더라도 그것이 달성할 수 없는 이상이라는 점에 있다.


스타크는 긴츠부르그의 구분이 단순하긴 하지만 더욱 정교화함으로써 도움을 줄 수 있다고 믿는다. 그 이유는 최근 AI 영역에서 AI 통계 분석이 두 구븐을 없애고 있다고 주장하기 때문이다(즉, 이론적 전제 없이 데이터만으로 신뢰할 수 있고 반복할 수 있는 결론을 끌어낼 수 있다). 다시 말하면, AI 연구자들은 데이터를 많이 넣으면 더 정확한 진실을 뽑아낼 수 있다고 주장하고 있다. 그러나 스타크에 따르면, 이것이 바로 긴츠부르그가 경고했던 것으로 이러한 주장은 이른바 생태학적 오류를 범하고 있다. 즉, 대부분의 사례에서 옳다고 해서, 그것이 어떤 한 사례에서도 반드시 옳다고 말할 수는 없다.


스타크는 기계학습 기반의 예측 시스템을 추측 과학, 특히 “어마어마한 규모로 자동화된 추측 과학”으로 정의하고, 그 한계를 분석하기 위해 ‘gayface’(일종의 유사과학적 관상학으로서 어떤 어굴을 가진 사람이 게이인가를 파악하는) 연구를 분석한다. gayface 연구자들은 얼굴과 성격을 어떻게 연결할 수 있는 정당화하면서, 보통 사람들이 다른 사람의 얼굴을 통해 그들의 성격, 정신 상태, 인구학적 특징을 정확하게 판단할 수 있음을 근거로 든다. 이런 판단은 완전히 정확하지는 않지만, 공통적이고 자연발생적이다. 즉, 개인이 때때로 정확히 판단할 수 있다면, 자동화된 모델이 대규모 데이터를 이용함으로써 훨씬 더 정확하게 판단할 수 있다는 것이 연구자들의 생각이다. 그러나 스타크는 그것이 완전히 오류라고 말한다. “즉, population(인구 또는 모집단) 수준에서 아무리 규칙성과 반복가능성이 존재하더라도, 개체 수준에서는 그것이 유지될 수 없으며, 사회 여건이 변화할 때도 유지될 수 없다.”(45) 스타크에 따르면, “자동화된 추측 시스템은 … 아포페니아적 기계이다. … 추측하려는 시도들은, 기껏해야, 질적 의미를 통해 획득한 잘 알려진 관찰을 복제할 뿐이다.”(45)


다음으로, 스타크는 “자동화된 추측의 사회적 한계”를 지적한다(46). 요컨대, 그것은 도덕적으로 중립적이지 않다. 그 연구자들은 이미 어떤 규범적 가정을 전제하고 자기 연구를 진행하게 된다. 더욱이 자동화된 시스템은 분석 범주를 만들고, 그 범주 안에 인간 주체들을 밀어 넣기 마련이다. 무엇보다, 그런 범주들은 때때로 사람들이 자기 자신을 인식하는 실제 틀로 작동하기도 한다. 그런 점에서, 이 자동화된 기계는 사회적‧윤리적 위험을 내포한다.


이상의 연구를 요약하면, 추측 과학 대 경험 과학의 구분은 일부 AI 낙관주의자들의 수사학에도 불구하고, 기계학습의 자동화된 추측에서 여전히 유지되고 있다. 더욱이, 이 같은 성찰성 없이 기계학습의 자동화된 추측은 윤리적 위험을 불러올 수 있다. 이 같은 사실은 “AI 시스템의 추론이 수집되고 분석되는 디지털 데이터뿐만 아니라 그 기술들의 개발을 뒷받침하는 로직과 내러티브에도 기반하고 있음을 보여”준다(49).



4.


흥미로운 논문이다. 긴츠부르그의 “추측 과학 대 경험 과학”을 꼭 끌어왔어야 하는 의문은 있다. 스타크가 말하는 대로, 다소 단순화된 구분이기 때문이다. 그보다는 귀납법, 연역법, 귀추법의 더 근본적인 구분으로 출발했어도 충분히 설득력이 있었을 것 같기 때문이다. ‘gayface’ 사례도 너무 전형적인 것 아닌가 하는 생각도 든다(누가 봐도 이상한 연구 아닌가). 물론 이것은 비판이라기보다는 사소한 투덜거림(?)에 가깝다.


“Divination and apophenic conjecture” 절은 핵심 주장과 어떤 연계가 이뤄지는 것인지 정확히 파악하지 못했다. 이후에 다시 읽어봐야 할 듯.


AI도 잘 몰라서인지, 아니면 스타크가 주장하는 내용들에 내가 꽤 동의하기 때문인지 특별히 더 할 말은 생각나지 않는다. 흥미로운 논문을 읽었다는 생각이 들고, 기회가 된다면, 다른 사람들도 읽어보기를 권한다.



5.


인상적인 문구들


“과학적 방법은 존재하지 않는다. 그러나 “과학적 방법”은 존재한다.” (38, Henry M. Cowles, The Scientific Method: An Evolution of Thinking from Darwin to Dewey, Cambridge, MA: Harvard University Press, 2020, pp. 1, 8.에서 재인용임)


“그것은 인간 경험을 분리되고 도구적이고 조작할 수 있는 변수로 평면화하는 것을 물화하고 자연화한다.” (41)





keyword
작가의 이전글사회 비평가로서 와이젠바움