'생각의 틈'에서 출발하여 '맥락 분석'에 도달하여 발견하는 통찰력
삼성전자가 2025년 2월에 야심차게 출시한 갤럭시 S25 시리즈의 초기 흥행 요인을 흥미롭게 비판한 커뮤니티 게시물이 있습니다. S25 시리즈 사전 예약 판매 기간 중에는 '이달의 우수사원' 밈처럼, 삼성전자가 내년 출시 예정인 S26 시리즈에 자체 개발한 모바일 애플리케이션 프로세서(AP) '엑시노스'를 탑재한다는 기사들이 쏟아졌습니다.
AP는 PC의 CPU처럼 스마트폰의 성능을 좌우하는 핵심 부품입니다. 내년에 출시 예정인 스마트폰이 현재 S25 시리즈에 탑재된 스냅드래곤보다 성능이 떨어질 수 있는 자사 개발 AP로 교체한다는 소식이 빠르게 퍼져나갔습니다. 갤럭시 S25 시리즈의 사전 예약 판매량은 전작 S24 시리즈보다 31% 증가했고, 현재까지 3,770만 대 이상 판매되며 역대 최고 성과를 기록하고 있습니다.
흥미로운 점은 단순한 소문이 갤럭시 S25 시리즈의 판매량에 영향을 미쳤다는 분석이 출시 후 여러 언론에서 사실로 다뤄졌다는 것입니다. 이는 판매 데이터만을 분석하는 대신 '맥락 분석'을 통해 전혀 다른 관점에서 원인을 발견한 흥미로운 사례입니다.
제2차 세계대전 당시 미군은 전투기의 생존율을 높이기 위한 조사를 실시했습니다. 전투에서 귀환한 비행기들을 대상으로 총알을 맞은 부위를 조사하여, 각 비행기에 남아있는 피탄 흔적을 그림에 빨간 점으로 표시했습니다. 부위별 평균 피탄 횟수는 엔진 부분 1.11발, 동체 1.73발, 연료계통 1.55발, 그리고 기체의 나머지 부분은 1.8발로 집계되었습니다.
이 데이터를 바탕으로 군 지휘부는 통계연구그룹(Statistical Research Group)에 전투기의 생존율을 높일 수 있는 방안을 요청했습니다. 철판을 덧대어 비행기를 보강할 계획이었기 때문입니다. 만약 여러분이 통계연구그룹(SRG)의 데이터 분석 전문가라면 어떤 결론을 내리시겠습니까?
대부분의 사람들은 데이터를 근거로 "빨간 점이 많은 부분을 우선적으로 보강해야 한다"고 말할 것입니다. 총알을 많이 맞는 부분을 보강해야 한다는 이 답변은 일리가 있어 보입니다. 하지만 당시 콜롬비아 대학교에서 통계학을 가르치던 에이브러햄 발드(Abraham Wald) 교수는 전혀 다른 관점을 제시했습니다.
발드 교수는 '피탄 흔적이 없는 곳을 보강해야 한다'고 주장했습니다. 발드 교수의 논리는 데이터와 상반되어 보였지만, 치열한 전투에서 피탄 흔적이 없는 부위에 총알을 맞은 비행기들은 아예 귀환하지 못했기 때문이라는 것이었습니다.
이 데이터의 조사 대상은 전투를 마치고 돌아온 비행기뿐입니다. 발드 교수가 지적했듯이, 빨간 점으로 표시된 부분들은 총탄을 맞아도 비행기가 무사히 귀환할 수 있었던 부위를 의미합니다. 따라서 오히려 빨간 점이 없는 부분, 특히 조종석 주변을 보강해야 했습니다. 발드 교수의 통찰을 교훈삼아 미군은 전투기 보완 계획의 방향을 획기적으로 전환했습니다.
앞서 언급한 미군 전투기 사례는 통계학에서 '생존 편향 이론(Survivorship Bias)'이라고 불리는, 데이터 표본 설정 시 흔히 발생하는 오류를 잘 보여줍니다. 이 사례는 실제 있었던 일이지만 다소 과장되어 전해진거죠. 사실 발드 교수의 진정한 업적은 '조건부 확률을 통한 비행기종별 생존률 향상을 위한 기체 보강 알고리즘'을 개발한 것에 있습니다.
그럼에도 인간은 살아남은 것에만 집중하고 보이지 않는 것은 간과하는 습성 때문에 오류에 빠지기 쉽다는 결론은 여전히 유의미하여 이 사례가 자주 활용됩니다. 데이터와 관련된 정황을 고려하면 데이터 활용 방향이 정반대로 나타날 수 있기 때문입니다. 이 사례에서는 '전투를 마치고 돌아온'이라는 정황이 바로 그러한 예시입니다.
이처럼 분석 맥락에 대한 이해가 데이터 분석에서 결정적 역할을 한다는 점을 고려하면 '생각할 수 있는 만큼 분석할 수 있다'라고 해도 과언이 아닙니다. 일반적으로 좌뇌는 논리적, 분석적 사고를 담당하고 우뇌가 감성적, 예술적 사고를 담당한다고 알려져 있습니다. 데이터를 단순히 요약하는 것을 넘어 맥락적이고 종합적인 분석을 하려면 우리는 좌뇌의 분석력과 우뇌의 상상력을 모두 활용해야 한다는 점에 주목해야 합니다.
데이터를 분석할 때에도 이는 마찬가지라고 볼 수 있습니다. 데이터 분석에서 중요한 것은 통계적 이론이나 툴이 아니라 ‘맥락적 사고력’이기 때문입니다.
위와 같이 가상의 데이터 분석 결과가 나온 경우를 또 다른 예로 들어보겠습니다. 왼쪽 그림의 X축과 Y축은 강한 상관관계가 있다고 해석할 수 있습니다. 대부분의 점들이 45도 정도의 선을 중심으로 가깝게 모여 있기 때문이죠.
하지만 '맥락'에 기반한 사고력을 활용하면 오른쪽 그림처럼 전혀 다른 결론이 도출됩니다. 그래프의 모든 점들을 하나의 집단으로 보면 양의 상관관계를 가진 큰 무리로 보이지만, 세부 그룹별로 나누어 보면 마이너스 45도선을 기준으로 세 개의 독립된 그룹이 존재함을 알 수 있기 때문입니다.
연산 기반 분석 역량에만 지나치게 몰입하게 되면 정작 필요한 창의적 ‘맥락’을 찾아내기가 어려워집니다. 더욱이 ‘맥락’이라는 개념을 제대로 이해하는 사람들은 분석을 통해 무엇을 알아낼 수 있고, 무엇을 알아낼 수 없는지, 또 심도깊은 분석 없이도 파악할 수 있는 ‘맥락’이 무엇인지를 미리 알 수 있는 능력을 갖추게 됩니다.
연산 기반 분석 능력은 분석의 목적과 그 목적이 형성된 '맥락'을 이해하고, 데이터 활용 방향을 명확히 설정한 후에야 비로소 얻을 수 있는 능력입니다. 이는 어떤 분석 기법과 도구를 효율적으로 활용할지 결정하는 단계이기도 합니다. 즉, '맥락적 분석'이 선행된 후에 분석 접근법 설계 역량이 필요하며, 그 다음에야 데이터 가공 역량이 발휘되어야 합니다.
'맥락 분석' 능력이 데이터 기반 의사결정에서 날이 갈수록 중요해지는 이유는 우리가 활용할 수 있는 데이터의 양이 감당하기 힘들 정도로 증가하고 있기 때문입니다. 목적은 단순히 목적일 뿐입니다. ‘맥락 분석’이 없다면 분석이 효과적인 답을 도출할 수 있는지, 어떤 데이터가 필수적이고 불필요한지, 그리고 필요한 데이터들 사이에서 우선순위를 정하는 것조차 불가능해집니다.
우리는 지금까지 '생각의 틈'이라는 렌즈를 통해 데이터를 바라보는 새로운 시각을 탐구해왔습니다. 마치 발드 교수가 전투기의 피탄 흔적이 없는 부분에서 숨겨진 진실을 발견했듯이, 우리도 데이터 너머에 있는 맥락의 중요성을 깨달았습니다.
데이터는 단순한 숫자의 나열이 아닙니다. 좌뇌의 분석력과 우뇌의 상상력이 조화롭게 어우러질 때, 우리는 비로소 데이터가 전하는 진정한 메시지를 이해할 수 있습니다. 그것이 바로 '맥락적 사고'가 우리에게 선물하는 통찰력입니다.
이제 우리는 알고 있습니다. 진정한 데이터 분석의 힘은 단순한 통계적 기법이나 도구가 아닌, 맥락을 이해하고 해석하는 우리의 능력에 있다는 것을. 이것이 바로 필자가 '생각의 틈'을 통해 발견한 소중한 깨달음입니다.