닉 폴슨, 제임스 스콧의 『수학의 쓸모』
바야흐로 인공지능, 즉 AI (artificial intelligence)의 시대라는 것을 부정할 이가 있을까 싶다. 그 힘에 대해 우리나라 국민이 정확하게 인지하기 시작한 게 이세돌 9단과 바둑대결을 펼친 알파고 때문이었지만, 사실은 그 이전부터 AI는 우리 세계에 깊숙이 들어오고 있었다. 알파고는 그걸 극적인 방법으로 보여주었을 뿐이다(또 그걸 노린 것이기도 했다). 2020년 현재 AI는 적용되지 않는 분야가 거의 없을 만큼 보편화의 길을 걷고 있다. 그런데 우리는 AI가 무엇인지 얼마나 알고 있을까? 더 중요하게는 AI가 어떤 원리에 작동하는 것일까?
이 책의 원제는 “AIQ (Artificial Intelligence Quotient)”, 인공지능지수다. IQ, EQ를 비롯해서 수많은 지표가 우리 주위를 떠도는데, 저자는 AIQ라고 하여 또 하나의 지표를 설정한 것 같지만, 정작은 이건 어떤 값을 나타내는 것은 아니다. 다만 우리가 AI에 깔린 원리를 이해하는 정도를 나타내는 것이고, 그것을 보여주는 것이 이 책이다. AI가 그냥 단순히 인간의 지능을 흉내내서, 인간의 일을 대신하거나, 혹은 인간의 능력을 앞서서 대신하는 위험한 존재가 아니라 그게 어떤 특징을 지닌 것이며, 논리에 의해서 만들어진 것인지를 이해시키는 것이다. 그것은 AI와 함께 살아가야 하는 우리에게 반드시 필요한 ‘지수’인 셈이다.
AI를 이해하는 것은 기본적으로 통계와 확률을 이해하는 것이다. AI가 확실성이 아니라 확률을 다룬다는 점에서, 통계적 법칙에 의거해서 따라야 할 명령이 무엇인지 스스로 데이터를 학습한다는 점에서, AI는 수학의 영역에 속한다고 할 수 있다. 그래서 AI를 이해한다는 것은 수학을 이해한다는 것이고, 따라서 수학이야말로 현대 사회를 떠받치는 주요한 수단이라는 얘기가 된다. 즉, 수학은 쓸모가 있는 것이다(다만 수학을 배우는 학생들이 늘 수학이 무슨 쓸모가 있냐고 하지만, 사실 역사상 진지하게 수학이 쓸모 없다고 한 적은 없다. 더 중요하게는 쓸모가 없었던 적은 더더욱 없다).
닉 폴슨과 제임스 스콧이라는 통계학들은 AI가 활용되는 역사와 예를 통해서 AI가 어떤 특징을 가지고 있으며, 어떤 원리에 의해 작동하며, 어떤 힘을 가지고 있는 것인지를 보여주고 있다. 그 첫 번째 예는 바로 우리에게 더더욱 친숙하게 다가오는 Netflix이다. Netflix의 시작은 비디오대여점이었다. 수많은 비디오를 대여하고, 사람들의 선호도에 대한 방대한 데이터가 쌓이자 그것을 확률에 의해 분석하기 시작했고, 그것이 추천 시스템이 되었다(그 아래의 논리로 2차 세계대전 때 전투기의 생환 확률에 관한 잘 알려진 얘기가 있다). 조건부 확률이라는 근거에 기초한 AI를 통해 Netflix는 개인화에 성공하고 있다.
그리고는 데이바 소벨의 『유리 우주』에서 소개한 헨리에타 레빗이 등장한다. 그녀는 20세기 초반 하버드 천문대의 컴퓨터(계산하는 사람이라는 의미)였다. 천문대장의 호의, 내지는 선경지명에 힘입어 박봉으로 천문 관측을 하고 계산을 했다. 그녀는 그 과정에서 아주 중요한 발견을 했지만, 명예는 대체로 천문대의 남성들에게 돌아갔다. 그녀가 발견한 것은 우주의 크기를 재는 방법이었다. 맥동변광성의 밝기 주기가 변하는 것을 토대로 밝기를 알아낼 수가 있고, 그것을 바탕으로 지구로부터의 거리를 계산할 수 있다는 것을 보여주었다. 그녀는 컴퓨터라 불렸지만, 지금의 컴퓨터 비슷한 것은 전혀 없이 연필과 종이로 이 일을 했다. 그런데 이게 왜 AI와 관련이 있을까? 바로 ‘패턴’이다. 입력을 예상되는 출력에 대응시키는 규칙을 만든다. 그리고 그것을 많은 데이터를 통해 학습시킨다. 그게 AI라는 것이다. 레빗이 맥동변광성의 패턴을 통해서 우주의 크기를 알아낼 수 있었듯이 말이다.
AI에서 자율주행차가 빠질 수는 없다. 언젠가는 보편화될 자율주행차가 주변의 물체를 인식하고, 자신이 어디에 있는지를 확인하는 논리를 베이즈 규칙에 근거를 두고 있다고 설명하고 있다. 잃어버린 잠수함의 위치를 찾는 데 이용되며 그 효용성을 널리 알린 게 베이즈 규칙이다(이 내용은 여러 책에서 소개되어 왔다). 그리고 유방암 진단에서 양성 판정을 받았을 때 실제 유방암에 걸렸을 확률에 대한 것도 베이즈 규칙에 바탕을 둔다(이 역시 여러 책에 소개되어 왔다). 베이즈 규칙은 수많은 데이터의 홍수 속에서 가치 있는 데이터를 찾아내는 규칙이다.
그레이스 호퍼의 얘기는 솔직히 낯설다. 컴퓨터 언어의 선구자라고 하는 이런 인물이 미국에서 어느 정도 유명세를 탔었는지 모르지만, 그 유명세가 여기까지는 도착하지 않았던 것으로 생각한다. 그 이유는 컴퓨터를 이용하는 것에만 훨씬 많은 에너지를 써왔기 때문이 아닐까 생각한다. 컴퓨터에 명령을 넣는 원리라든가, 작동하는 방식에 대한 것보다는 말이다. 앞으로도 그런 경향은 변하지 않겠지만, 어떻게 컴퓨터가 인간의 언어를 이해하고, 명령을 따르는지를 알기 위해서는, 그리고 그 방식을 통해 영어를 자연스런 한국어로 번역하는지를 이해하기 위해서는 그레이스 호퍼가 무슨 일을 했는지를 아는 게 중요하다. 이 책은 그걸 아주 설득력 있게, 그리고 쉽게 보여주고 있다.
그 밖에도 뉴턴의 실수(또는 드무아브르법칙), 피임법의 효과에 대한 오해, 나이팅게일의 업적(그녀의 ‘과학적’ 업적은 간호가 아니라 통계, 혹은 통계의 그래픽화이다!) 등을 통해 AI가 어떤 원리를 가지고 있는지, 그리고 그것을 가지고 우리가 무엇을 할 수 있는지, 우리가 어떤 잘못을 저지르면 안 되는지를 알려준다. AI가 무조건 긍정적인 측면만 있는 것은 아니라는 것은 분명하다. 그리고 그 부정적인 측면을 강조하는 경우도 쉽지 않게 접할 수 있다. 그러나 저자들은 AI가 분명 우리의 미래에 긍정적이라는 믿음을 가지고 있다. 하지만, 그렇다고 무조건 그렇다는 것은 아니다. AI는 한계를 가지고 있다. “어떤 문제들은 너무나 중요하기에 연산만 할 줄 아는 알고리즘에 맡길 수 없다.” AI가 점점 더 중요해지고 우리 삶에 깊이 파고들 것이 분명하다. 그리고 그런 시대에 모든 것을 AI가 할 것이라고 기대하거나 걱정한다. 하지만, 저자들은 AI는 그래도 기계라는 것은 부정하지 않는다. 그래서 “이제는 인간과 기계가 함께 일할 때”라는 것을 강조한다. 인간이 없는, AI는 위험할 뿐만 아니라 의미를 잃어갈 것이다.