스포츠 이벤트하면 올림픽과 월드컵이 있죠. 데이터 바닥에도 이벤트가 있습니다. 바로 선거죠. 비록 올림픽이나 월드컵만큼은 아니지만 어느 후보가 얼마 큼의 지지를 받아 당선되느냐에 많은 이들의 관심이 쏠립니다. 국내에선 대통령 선거-국회의원 선거-지방 선거 이렇게 있고 국외로 치면 미국 대선 정도가 이벤트로 꼽히겠군요. 어제 바로 그 미국대선이 있었습니다. 이번주 내내 독감으로 제 컨디션이 아니었지만 놓칠 순 없죠. 흥미롭게 지켜봤습니다.
개인적으로는 데이터 이벤트가 벌어질 때마다 상당히 조심합니다. 괜히 입이나 손을 잘못 놀렸다가 불필요한 오해를 불러일으킬 수 있거든요. 어느 정도 확실한 신호나 추세, 포인트가 확인되었을 때 주변 지인들에게만 슬쩍 얘기하는 편입니다. 사실 그래도 분석이 업인데 틀리면 망신이라는 약간의 부담도 없지 않아 있습니다. 적어도 저에게 데이터 이벤트는 결과를 맞춰야 본전인, 말 그대로 더러운 세상이거든요.
맞추면 본전, 틀리면 망신 아임미까
이번 미국 대선 개표방송을 보면서 그런 생각이 들었습니다. 앞으로 정신 바짝 차리지 않으면 망신살 제대로 뻗치겠구나. 손과 입을 더 무겁게 가져가야겠구나. 이건 확신에 가까운 감정이었습니다. 거참.
샤이는 없다. 다만 응답하지 않을 뿐이다
흔히 숨겨진 지지층을 일컬어 샤이 000이라는 표현을 씁니다. 이 표현엔 지지 자체를 부끄러워하기에 드러내지 못한다는 부정적 의미가 내포되어 있지요. 부끄러움을 숨김이라는 행동의 동인으로 가정하고 있습니다. 하지만 이 가정은 절반만 맞습니다. 여러 가지 이유로 지지 행위 자체를 부끄러워한다는 가정은 성립할 수 있지만 그것 때문에 드러내지 않는다는 가정은 성립하지 않거든요. 굳이 드러낼 필요가 없기에 하지 않는 것뿐입니다.
일단 공정하지가 않습니다. 응답자는 자신의 선택을 공개하지만 그에 따른 보상은 없습니다. 여기에 응답자는 최소 10분에서 길게는 30분에 걸친 긴 시간 동안 지루한 답변을 해야 하는 추가부담도 지게 됩니다. 요즘엔 약간의 보상을 한다는 얘기도 들리긴 하던데 글쎄요. 손해는 응답자가 지고 이득은 여론조사 업체가 가져갑니다. 지난 수십 년간 유지된 게 신기할 만큼 불합리한 구조입니다. 미국도 아마 사정은 다르지 않을 겁니다.
과거에 비해 응답률이 확연히 떨어집니다. 여론조사를 완성하려면 기한 내에 할당된 셀을 채워야 하는데 그게 생각만큼 쉽지 않습니다. 그래도 메워는 넣어야 하니 업체에선 여러 대체기법들도 사용하게 해달라고 하소연을 합니다. 하지만 그 역시도 어디까지나 추정 혹은 비례 할당방식이라 오차가 생길 수밖에 없습니다.
여론조사의 절대원칙인 무작위성이 흔들리고 있는 셈이죠.
결과와 비용은 정해져 있지만 가중치는 모호하다
누가 의뢰를 했는가에 따라 달라지는 결과도 흥미로운 대목입니다. 우리와 달리 미국은 언론사가 성향과 지지후보를 밝힙니다. 우연인지는 모르겠으나 대체로 지지하는 후보에 유리한 결과가 도출되고 기사로 생산되어 유포됩니다.
아무래도 음성으로만 듣고 답하는 방식이니 질문의 순서는 물론 선택지 호흡이나 박자만 달라져도 응답률 혹은 결과의 차이가 발생할 수는 있습니다만 모아서 보면 신기하죠. 이럴 때 보면 사람만큼 민감하고 예민한 동물이 없구나, 여론조사의 특성상 온전히 중립적인 조사는 없으니 일정 부분 감수해야 하나 그런 생각도 들긴 합니다. 쓰고 보니 한국도 묘하게 그런 경향이 있군요.
비용은 글쎄요. 조금 얘기가 다릅니다. 조사의 질과 직결되는 문제거든요. 원래 여론조사가 제대로 하면 상당히 비쌉니다. 하지만 의뢰자가 100% 부담하는 경우는 거의 없는, 소위 정가와 시장가의 차이가 큰 용역이죠. 결과는 뽑아야 하는데 질문은 길고 응답률은 저조하니 창의적인 방법들을 씁니다. 아나바다 운동도 아니고 참.
상황이 이렇다 보니 요즘은 발표한 여론조사를 모두 취합해서 재구성하는 서비스를 많이 보시더군요. 다량의 여론조사라면 어느 정도 에러가 발생해도 1/N이 되니 모수 절대량으로 희석시킬 수 있다는 개념입니다. 개인적으로는 이 방식을 선호하지 않습니다. 제 눈엔 오염된 물을 희석시킬 만큼 깨끗한 물이 많지 않거든요.
AI를 활용한 예상 시뮬레이션 기법도 고민은 있습니다. 당장 이번 대선만 해도 직전 상승세에 과한 가중치를 부여한 측면이 있거든요. 시간이 지나면 개선되리라 믿습니다만 그게 언제가 될진 모르겠습니다. 시스템에 가중치를 부여하고 확인하는 것도 결국 사람이거든요.
딜레마, 어쩌면 예정되어 있던 결과
이번 대선의 가장 큰 이슈는 이민자 문제였습니다. 추정치긴 하지만 불법 이민자(진한 그래프)의 수가 급증한 걸 확인할 수가 있습니다. 불법 이민자 중 상당수는 저임금 블루칼라 노동자로 채용되는데 특히 미국인 노동자를 구하기 힘든 건설, 숙박, 식품 관련 기업에선 ‘더 많은 이민자를 고용하게 해 달라’고 요구하고, 고용지표는 안정되는데 부작용(물가상승)은 적으니 정책당국에서도 내심 반겼습니다. 이민자 효과를 기대한거죠. 하지만 이를 바라보는 미국인 노동자들의 생각은 아주 많이 달랐습니다.
미 의회예산국이 지난 1월에 추정한 00~24년 이민자 분류별 증가 추이. 진한색이 불법이민자.
미국 경제는 신기하리만큼 균형이 맞지 않습니다. 구글이나 애플, 마이크로소프트나 같은 초거대 기업들이 있어서 견고해 보이나 제조업은 상황이 다릅니다. 오죽하면 국가보조금으로 굴러간다는 얘기가 나올까요. 문제는 초거대 기업들이 창출하는 일자리가 그리 많지 않다는 점입니다. 제조업이 내려앉은 마당에 새로 창출되는 일자리는 한정적입니다. 이제 그 한정적인 파이를 불법 이민자들과 미국인 노동자들이 나누어야 하는 상황이 벌어진 겁니다. 이민에 대한 거부감은 점점 커졌습니다.
이를 감지한 바이든 행정부는 뒤늦게나마 국경 폐쇄까지 지시했지만 정작 이민자는 소폭 감소에 그칩니다. 고용지표는 나아질 기미를 보이지 않습니다. 실업률은 오르고 신규 고용은 좀처럼 늘지 않습니다. 급기야 지난 10월엔 10~11만 명 증가할 것이라는 전망이 무색하게 1만 2000명 증가에 그치고 맙니다. 허리케인과 파업으로 인해 신뢰도가 떨어진다는 분석이 있었지만 그 이전부터 꾸준히 기대에 못 미쳤던 것 역시 사실입니다. 경제를 살릴 인물로 누가 더 적합하냐는 설문조사에서 약 8%가량 앞선 것도 그때 즈음이었습니다.
어쩌면 시장의 판단은 그 때 내려졌던 게 아닐까란 생각도 해봅니다.
'난 사람의 얼굴을 봤을 뿐 시대를 보지 못했소. 시시각각 변하는 파도만 본 격이지. 바람을 봐야 하는데. 파도를 움직이는 건 바람인데 말이오.' 영화 관상 마지막 장면의 대사 중 일부입니다. 많은 것이 녹아 있는 대사죠.
여러 번의 데이터 이벤트를 겪으면서 얻은 교훈은 그렇습니다.
공동체가 처해있는 객관적인 상황을 확인하고 이를 뒷받침할 데이터를 확인하라.
여론조사는 제일 마지막이다.
이번 미국 대선도 예외는 아니었습니다. 오늘은 감기가 좀 나았으면 좋겠군요(쿨럭)