AI에게 필요한 건 더 빠른 계산이 아니라, 더 깊은 맥락
한 번쯤 이런 경험이 있을 것이다.
최신 AI 챗봇에게 “요즘 사람들이 가장 많이 쓰는 스마트폰이 뭐냐”고 물었을 때, 돌아오는 답변은 놀라울 만큼 정확하다. 제품명도 맞고, 시장 점유율이나 주요 스펙도 틀리지 않는다. 하지만 질문을 조금만 바꿔 “왜 이 스마트폰을 좋아하느냐”, “손에 쥐었을 때 어떤 느낌이 드느냐”고 물으면 분위기가 달라진다. 설명은 이어지지만, 그 답변은 어딘가 평면적이다. 기능은 말하지만, 사람의 감정과 맥락은 빠져 있다.
이 장면은 지금까지의 AI 개발 방식이 가진 한계를 상징적으로 보여준다.
전통적인 AI는 인터넷에 축적된 텍스트와 이미지, 즉 정적인 데이터를 중심으로 성장해왔다. ‘무엇이 무엇이다’라는 사실을 설명하는 데에는 강하지만, 사람들이 실제로 어떤 상황에서, 어떤 감정으로, 왜 그런 선택을 했는지까지 이해하기에는 구조적인 제약이 있었다.
이 한계는 최근 다양한 분야에서 더욱 분명해지고 있다.
특히 로봇, 자율주행, 헬스케어처럼 현실 세계와 직접 맞닿는 AI, 이른바 피지컬 AI 영역에서는 문제가 더욱 두드러진다. 실제 환경은 끊임없이 변하고, 사람의 판단은 상황과 감정에 따라 달라지는데, 정적인 데이터로 학습된 AI는 이 복합적인 맥락을 따라가기 어렵다. 이런 배경 속에서 물리 환경과 상황을 가정해 학습시키는 합성 데이터가 중요한 대안으로 등장했다.
하지만 합성 데이터가 늘어난다고 해서 문제가 모두 해결되는 것은 아니다.
환경과 조건은 시뮬레이션할 수 있어도, 그 상황을 마주한 사람이 어떻게 느끼고, 왜 그렇게 반응했는지까지 완전히 담아내기는 어렵기 때문이다. 결국 질문은 다시 사람에게로 돌아온다.
이 질문은 점점 더 많은 AI 개발자들에게 공통된 고민으로 떠오르고 있다.
“AI는 사람의 행동은 설명할 수 있지만, 경험은 이해하지 못하는 것 아닐까?”
여기서 말하는 경험이란 단순한 사용 이력이 아니다. 특정 상황과 감정, 그리고 맥락 속에서 이루어진 선택의 과정 전체를 의미한다.
문제의 핵심은 지금까지 AI가 학습해온 데이터의 성격에 있다.
전통적인 AI는 인터넷에 축적된 텍스트와 이미지, 즉 정적인 데이터를 중심으로 발전해왔다. 이러한 데이터는 ‘무엇이 무엇이다’라는 사실을 설명하는 데에는 뛰어나지만, 사람들이 실제로 어떤 환경에서, 어떤 감정 상태로, 왜 그렇게 행동했는지까지 담아내기에는 구조적인 한계를 가진다.
이 한계는 크롤링이나 로그 기반 기술이 고도화될수록 오히려 더 분명해진다.
클릭 수는 남지만 망설임은 기록되지 않고, 리뷰는 남지만 말하지 않은 이유는 사라진다. 데이터는 계속 쌓이지만, 맥락은 누락된다. 그 결과 AI는 점점 더 많은 정보를 알게 되지만, 현실은 오히려 평면적으로 이해하게 된다.
바로 이 지점에서 질문은 다시 이어진다.
“그렇다면 사람의 경험과 맥락은 어디에서 데이터로 확보할 수 있을까?”
기존의 기술적 접근만으로는 이 공백을 메우기 어렵다는 인식이 확산되면서, 전혀 다른 방향의 해법이 다시 주목받기 시작한다.
그 대안으로 떠오른 것이 에스노그래피(Ethnography)다.
에스노그래피는 데이터를 단순히 ‘수집’하는 방식이 아니라, 사람의 행동이 만들어지는 과정을 ‘관찰’하는 접근법이다. 무엇을 했는가보다, 왜 그렇게 할 수밖에 없었는지를 추적하며, 말로 표현되지 않은 감정과 상황의 맥락을 기록한다. 즉, 정적인 정보가 아니라 경험이 발생하는 조건 자체를 데이터로 전환하는 방법이다.
물론 에스노그래피에도 분명한 한계는 있다.
깊이 있는 이해는 가능하지만, 비용과 시간, 확장성 측면에서 대규모 AI 학습에 그대로 적용하기는 어렵다. 이 때문에 에스노그래피는 오랫동안 AI 개발과는 거리가 먼 정성적 연구로만 인식되어 왔다.
그래서 최근 데이터 과학자들이 주목하는 해법은 하이브리드 접근이다.
정적인 데이터가 제공하는 규모와 안정성 위에, 에스노그래피를 통해 확보한 동적·맥락적 데이터를 결합하는 방식이다. 이렇게 하면 경험 데이터가 갖는 편향을 완화할 수 있고, 동시에 AI가 사람의 선택과 판단을 보다 입체적으로 이해할 수 있다.
결국 지금의 AI 개발은 단순히 더 많은 데이터를 모으는 경쟁이 아니다.
어떤 공백을 인식하고, 그 공백을 어떤 데이터로 메우느냐의 경쟁이다.
정적 데이터의 시대를 넘어, 동적 데이터의 시대로 이동하는 이 전환점에서, 사람의 경험을 이해하려는 시도는 선택이 아니라 필수가 되고 있다.
AI가 진짜 현실을 이해하기 위해 필요한 것은 더 빠른 계산이 아니라, 더 깊은 맥락이다.
그리고 그 맥락을 데이터로 다루기 위한 새로운 시도가 지금, 다시 시작되고 있다.
정적 데이터에서 동적 데이터의 시대로 ...