사용자는 False Alarm을 제일 싫어한다.
사용자가 인터넷상에서 정보를 요청하면 다음 4가지 상황이 발생한다.
1. 사용자가 원하는 정보가 도착했고, 사용자도 이를 정확하게 선택한 경우. Hit이라 한다.
2. 사용자가 원하는 정보가 왔으나 무시하거나 놓치고 새로 쿼리(검색)를 시도하는 경우. Miss라 한다.
3. 사용자가 원하는 정보가 아닌데 원하는 정보라 착각하여 시간을 낭비하는 경우. False Alarm이라 부른다.
4. 사용자가 원하는 정보가 아니고, 사용자도 아니라 판단하여 다시 쿼리(검색)를 하는 경우. Correct Rejection이라 한다.
1번은 최고의 상황이고 2번 4번은 시간이 거의 들지 않으니 가장 불쾌한 상황은 3번 상황이다. 따라서 사용자 관점에서 3번을 얼마나 줄일 수 있는가가 해당 정보 서비스의 경쟁력이라 볼 수 있다. 3번 상황은 주로 노이즈 수준이 높거나 사용자가 판단하는데 시간이 많이 걸리는 경우 발생한다.
현재 인도 스캠회사들을 필두로 많은 페이지 오너들이 구글의 Page Rank 알고리즘을 속여 대거 상위 노출을 시킨다. 그러다 보니 구글 초기 시절에 비해 상당히 노이즈가 높아져 있고 구글에서 검색을 하면 반복적으로 3번 상황에 노출된다.
검색엔진은 목록을 제공해 주는 서비스다. 따라서 사용자는 목차만 보고 일차 판단을 하게 되고 페이지 이동을 하고 나서야 자신이 원했던 정보인지 온전한 판단을 할 수 있다. 그래서 시간이 오래 걸린다. 최근에는 일단 목록에서 낚은 후 끝까지 읽으려면 결제나 가입을 유도하는 페이지가 더 늘어나는 추세라 3번 상황이 더 많이 발생하고 있다.
구글도 손을 놓고 있는 것은 아니다. 예를 들어 검색 결과 단계에서 페이지 이동 없이 바로 요약본을 노출하는 시도를 확대하고 있다. 하지만 독립적인 페이지 오너들과 구글 사이 트래픽에 대한 이해충돌을 고려하면 이 또한 한계가 명확해 보인다.
구글 검색에 비해 ChatGPT 같은 거대언어모델은 페이지 이동이 없고 즉각 프롬프트에 뜨기 때문에 일단 사용자가 원하던 정보인지 판단하는 것이 빠르다. 따라서 3번의 상황을 2번 4번으로 분산하는 효과가 발생한다. 그래서 ChatGPT를 사용할 때 만족감이 구글 검색을 사용할 때보다 훨씬 클 수밖에 없는 것이다.
검색엔진들은 어떻게 해야 할까. 의외로 나는 네이버처럼 가야 한다고 본다. 네이버는 주식, 날씨, 스포츠, 쇼핑, 맛집 등 거대언어모델은 최신성을 유지하기 힘든 정보에 대해 이동 없이 결과를 예쁘게 큐레이션 하여 보여준다. 특히 쇼핑은 정보를 노출하는 것을 넘어서서 네이버페이를 이용하여 직접 보증효과를 만들어 내고 있다. 한 편으로는 생태계 내 서비스들을 우선적으로 노출시키기 때문에 페이지 오너들과의 이해충돌도 적은 편이다. 나는 거대언어모델 시장에서 구글보다 네이버가 더 잘 버틸 것이라 판단한다.
검색엔진이 아닌 나머지 지식정보서비스들은 답을 인간관계에서 찾아야 한다. 즉 검색엔진 혹은 퍼블리싱 서비스에서 제공하지 못하는 친밀감을 바탕으로, 원하는 정보를 제공하는 것이 아닌 제공한 정보가 원하는 것이 되는 마이크로 커뮤니티 모델을 만들어 내야 한다. 유튜브와 홀릭스 같은 지식 인플루언서 서비스들은 이런 방식으로 거대언어모델과 직접 충돌은 피하는 한 편, 오히려 거대언어모델이 제공하는 생산성 덕분에 새로운 기회를 맞을 것이다.