#10. 토리양말의 문장 속 거닐기 - 통계의 허상

데이터에 대한 의심

by 토리양말


훌륭한 결과물, 미스터 A.I.

빅데이터, 통계에 기반한 많은 그래프와 결과물들이 일상 속에 쏟아지고 있고, 우리 삶도 직간접적인 영향을 받고 있다. 직간접적인 영향을 받는다는 좀 더 정확한 의미는 “빅데이터, 통계가 알려주는 사실이 적어도 거짓말은 하지 않을 것이다. 그리고 우리가 생각하는 것보다 의외로 정확하다.”는 가정을 전제로 하고 있다고 볼 수 있다.


실제로, 우리가 경험하고 목격한 바로는 ‘인공지능’은 인간의 인지 범위보다 훨씬 더 다양하고 폭넓은 차원에서 사회적 현상과 앞으로 일어날 일들에 대한 전망을 비교적 정확하게 집어내는 능력을 보여주고 있다. 이러한 인공지능의 기능은 앞으로도 더욱 발전될 것이고, 우리 생활 곳곳에 좀 더 밀접한 연관을 맺어갈 것으로 예상된다.



판을 설계하는 것은 사람 - ‘허깨비 승리’로 가는 도화선

하지만, 이러한 인공지능 플랫폼 기반이 항상 올바른 결론을 내려주는 것인지는 생각해 볼 필요가 있을 것 같다. 적어도 통계라는 믿을만한 자료? 이기에 무작정 신뢰하면 되는 것일까?


최초 해당 작업의 목적을 설정하는 것은 사람이 하는 것이고, 그 목적에 맞게 인공지능 분석에 필요한 각종 데이터 가공, 알고리즘 적용이 시작된다는 것을 감안하면, 최종적인 결과물을 얻기 위해 사전에 어떤 전제와 목표를 설정했는지, 그리고 목적에 맞는 데이터를 정확하게 분류해서 알고리즘에 반영했는지도 살펴보아야 한다. 예를 들면, 정부에서 발표하는 ‘취업률’ 통계 수치를 사람들이 신뢰하지 않는 가장 큰 이유는 취업한 사람으로 분류하는 기준이 현실보다는 완화해서 폭넓게 가져가기 때문에 그러하다. 학부 졸업을 하고 나서 대학원에 진학하는 경우도 취업을 한 것으로 반영이 되는가 하면, 노인들의 공공근로 사업 참여도 취업률에 반영하는 경우가 대표적인 예이다. 그러한 이유로 실제 구직 시장에 넘쳐나는 청년 실업자가 많음에도 정부가 발표한 취업률은 높은 수치로 나타난다.


수단이 목적을 대체할 때, 이는 결과의 왜곡으로 이어진다. 정부가 보고 싶어 하는 성공(높은 취업률)과 실제 결과가 이렇듯 서로 괴리되는 현상은 바로 이러한 차이에서 기인한다.



듣고 싶은 것 보고 싶은 것만 원하는 것은 아닌지, 돌아볼 필요가

‘답정너’라는 말이 있다.

‘답은 정해져 있으니, 너는 대답만 하라’는 의미이다. 어찌 보면, 우리는 삶을 살아가면서, ‘그렇게 되었음직한 결과’를 바라면서 살아가는 경우가 많다. ‘돈을 많이 벌고 싶다’, ‘직장에서 승승장구하고 싶다’, ‘좋은 배우자를 만나서 행복한 가정을 이루고 싶다’ 등등… 하지만, 정작 그러한 결과를 얻기 위해서 우리는 얼마나 노력을 하면서 준비를 해왔는지 생각해보면 자신 있게 ‘예’라고 답변할 수 있는 사람은 과연 몇이나 될까?


빅데이터, 인공지능으로 요약되는 4차 산업혁명도 어찌 보면 인간들이 그동안 바랬던, 인간이 바라보는 관점에서는 지극히 바람직한 결과를 얻기 위한 또 다른 결과물일 수도 있다. 일을 하는 데 있어서 인간의 노동력을 최소화하되, 가장 효율적이고 현실적인 방향을 제시하는 것이 바로 그것이다.


누군가의 말대로 이 유용한 도구가 정말 유용하게 사용될지, 아니면 악마의 탈을 쓴 또 다른 무기로 악용될지는 우리 인간들의 선한 의도가 얼마나 자리 잡고 있느냐가 가장 중요한 게 아닐까라는 생각이 든다. 복잡하고 자칫 화려해 보이는 각종 알고리즘보다 말이다.



keyword