brunch

You can make anything
by writing

C.S.Lewis

by STEVE HAN Jan 27. 2023

ChatGPT는 검색 서비스가 될 수 있을까?

ChatGPT와 구글 검색을 비교해 보자

모두들 ChatGPT에 대해 한마디씩 하고 글을 쓰고 평가와 의견을 제시하는 중이라 나까지 참전하지 않아도 될 것이라고 생각했다. 그러나 여러 사람들과 얘기를 나눠보다가 내 생각을 좀 정리할 필요가 있다는 마음이 들어서 글을 쓰기로 했다. ChatGPT가 어떤 서비스고 어떻게 구현하고 어느 성과를 보이고 있는 가에 대해서는 생략하기로 한다. 


오픈AI가 ChatGPT를 공개한 후 구글이 코드 레드를 발동하고, 마이크로소프트가 빙 검색에 ChatGPT를 통합(연계?) 한다는 얘기가 나오면서 (이미 마이크로소프트는 여러 제품에 AI 기술을 통합하거나 녹여 놓고 있어서 자연스러운 수순이라고 생각했다), 과연 매우 똑똑한 챗봇 서비스가 검색 서비스를 대신하거나 상당한 수준으로 그 영역을 차지할 수 있을 것인가에 대해 생각해 봤다. 


우선 구글에 가면 구글의 미션은 'Google의 목표는 전 세계의 정보를 체계화하여 누구나 유용하게 이용할 수 있도록 하는 것입니다.'라고 되어 있고, 구글의 검색 서비스는 'Google은 사용자에게 가장 관련성이 높고 유용한 정보를 표시하기 위해 웹과 기타 소스를 꾸준히 매핑합니다.' 'Google은 다양한 방식 중 사용자가 찾고 있는 정보의 유형에 가장 유용한 방식으로 결과를 표시합니다.'라고 설명하고 있다. 즉, 검색 서비스는 인간이 생성한 수 많은 정보와 지식 중에 (주로 웹사이트를 통해 공개한 것을 바탕으로) 사용자가 찾고자 하는 것을 가장 유용한 방식으로 표시하는 것을 말한다. 


ChatGPT를 소개하는 오픈AI에서 처음 발표한 블로그 글에서는'ChatGPT는 대화를 위한 언어 모델 최적화'라고 하며, '우리는 대화 방식으로 상호 작용하는 ChatGPT라는 모델을 훈련했습니다. 대화 형식을 통해 ChatGPT는 후속 질문에 답하고, 실수를 인정하고, 잘못된 전제에 이의를 제기하고, 부적절한 요청을 거부할 수 있습니다.'라고 명확히 이는 대화형 AI이지 검색 서비스를 위한 것이라고 하고 있지 않다. 


그럼에도 불구하고 많은 사람들이 구글 검색의 아성이 위협받고 있다고 말하고 있다. 그런데 잠깐, 우리가 어떤 새로운 플레이어가 기존 거인을 무너뜨릴려면 뭔가 기존의 서비스에서 만족하지 못한 소수가 열광하는 기능과 서비스에서 출발하는 것 아닌가? 그럼 기존 구글 또는 네이버에서(네이버는 내부 콘텐트 검색용이라 이 논의에서 빼고 싶지만) 만족하지 못한 점을 ChatGPT가 구현하는 것이 무엇인가? 그냥 생각보다 똘똘한데? 오 기대 이상이야. 하면서 구글 검색을 사용하지 않을 수 있을까?


난 크롬에서 ChatGPT를 확장해 사용할 수 있는 앱을 통해 몇 주 동안 두 개의 결과를 비교해 봤다. 


1. 우리가 어떤 검색을 할 때 단지 하나의 대답을 원하는 것일까? 예를 들어 '루마니아의 수도는 어디지?'라고 검색하는 경우, 우리는 '부쿠레슈티'라는 답만 원하는 것 보다는 그에 관련한 여러 정보를 원하는 경우가 더 많다.


아래 그림은 내가 크롬에서 검색한 결과이다. 검색은 다양한 정보 중에 나에게 가장 관련성이 있고 유용할 것이라고 판단하는 것을 체계적으로 보여주는 것이다. 
 


우리는 얼마 전까지 아마존이나 시리, 구글 어시스턴트가 내가 하는 질문에 간단한 대답을 하는 것에 대해 열광했지만 (물론 음성이라 길게 듣고자 하지는 않았다), 그렇게 하나의 '정답'을 알려주는 서비스는 사랑 받지 못했다. 알렉사 부문이 일년에 100억 달러의 적자를 기록했고 구글 어시스턴트도 사업 전략을 재 검토한다는 것이 그런 소비자 반응에서 왔다고 본다. 처음에는 이를 통해 광고도 가능하고 쇼핑이 이루어질 것이라고 봤지만 대부분의 사용자는 그렇게 반응하지 않았다. 


2. 검색의 결과를 어떻게 믿을 것인가?


예를 들어 '전구를 발명한 사람이 누구인가?' 하는 질의를 하면 구글에서는 다양한 정보를 그 정보 소스와 함께 보여주지만 ChatGPT는 단지 토마스 에디슨이라고 대답한다. 

우리는 하나의 사실에 대해서도 여러 다른 정보가 있고 때로는 이를 통해서 보다 깊이 있고 유용한 정보와 지식을 얻게 된다. 그리고 그 근거가 어디에 있는 가에 대해 다양한 웹사이트에 있는 추가 정보와 참고 자료를 통해 생각의 깊이와 넓이를 확장하기도 한다. 


ChatGPT가 생성하는 대답은 도대체 무엇을 근거로 어디에서 나온 사실인지 현재는 알기 어렵다. 


움베르토 에코는 우리가 키워야 하는 능력은 다양한 검색 결과를 비교하면서 어느 것이 좀 더 진리에 가까운지, 어느 것이 보다 사실에 부합하는 것인지를 판단할 수 있는 능력이어야 한다고 했다. 챗봇이 알려주는 정보가 무엇을 기반으로 했는 가에 대한 제시가 없다면 우리는 늘 그 대답에 대해 신뢰할 수 있을까를 다시 확인해 봐야 한다. 


물론 ChatGPT가 그런 대답을 어떻게 알게 되었는지 또는 믿을 수 있는 레퍼런스가 무엇인가를 추가적으로 질문해 나가면서 알아낼 수는 있지만 여전히 자신의 대답을 강화하기 위한 것이지 다른 의견이 있을 수 있음을 알려주지는 않는다. 


더군다나 여러 경우에 잘못된 정보를 제공하고 있고, 그 이유를 명확히 알거나 사전에 판단할 수 없는 상황에서는 이를 검색에 바로 사용하기는 위험하다는 것이 구글의 입장이다. 기업의 평판이 더 중요하다고 하는 것이 구글 내부 메모에서 나온 얘기이다. 


3. 실시간 정보 검색은 아직 어렵다.


교통 상황, 여행 루트, 식당의 메뉴 등등에 대한 질문에서 구글은 언제나 현재 내 위치를 기준으로 여러 가지 유용한 정보를 제공하지만, ChatGPT는 일단 내 장소를 알려줘야 하며, 자신은 실시간 정보를 알고 있지 못하다고 대답한다. 


다시 말해 우리가 구글 검색을 사용하는 여러 경우는 생활에 유용한 정보를 찾기 위함인데, ChatGPT는 아직 이런 준비가 되어 있지 못하다. 물론 이는 학습의 문제이기도 하고, 결국 검색 엔진과의 연계 방안을 모색해야 하지만, 누가 주가 되고 누가 보조가 될 지는 좀 더 두고 봐야 할 것이다. 


정보의 검색은 단지 웹사이트 크롤링으로만 이루어지는 것이 아니라 수 많은 데이타베이스에 대한 접근, 각종 정보의 관계에 대한 지식 그래프 등이 같이 있어야 좀 더 의미 있고 충실한 정보 검색이 가능하다. 이 점은 빙도 부족하고 ChatGPT도 부족하다. 


4. 채팅을 통한 검색이 수익 모델을 가질 수 있을까?


우리는 검색을 무료로 사용하고, 우리의 행동과 관심을 제공해 광고를 보며, 기업은 이를 통해 자신의 비즈니스를 유지 또는 강화한다. 챗봇이 어떤 광고성 정보를 제공하는 순간 그 신뢰성을 그대로 무너질 것이다. 아마존의 에코에서 알렉사가 권하는 물건을 통해 광고성 대화를 유도했지만 결과는 우리가 아는대로 실패했다. 특히 이 부분은 공정성 문제로 큰 시비 거리가 될 것이다.


구글의 제프 딘이 얼마전 메모에서 구글이 더 훌륭한 챗봇 엔진을 갖고 있지만 아직 검색에 활용하지 않는 이유 중 하나는 이 광고 모델에 손상을 가져올 것이라는 점이라고 말했다.  


지금 선 보이는 유료 사용 모델은 잠시 테스팅이라고 생각하며, 아마 다른 서비스에 API를 제공하며 그를 통한 수익 추구가 더 이루어질 수 있을 것이다. 그러나 그건 검색 서비스가 아니라 어시스턴트 서비스일 가능성이 높다.


기업의 고객 지원 분야에서 활용성에 대해서는 지난 6개월 동안 여러 관련 기업과 얘기해 보면, 소위 거대 언어 모델이라고 하는 LLM 보다 더 저렴하면서 더 효과적인 방법이 있는데, 굳이 LLM을 기업용 정보 검색이나 채팅 서비스에 사용하고자 하지 않는다는 대답이 더 많았다. 


이 밖에도 비용의 문제, 에너지 소비의 문제, 편향과 공정성의 문제가 있고 또 드러나겠지만, 이 글에서는 검색 서비스와 ChatGPT의 관계만 살펴 본다. 


스타트렉에 보면  전체를 총괄하는 컴퓨터도 있고, 유니버설 트랜스레이터도 있고 (이건 우주선 커뮤니티케이션 시스템에도 내장되고), 데이터 안드로이드도 있다. 대화형 언어 모델로 만들었다는 녀석을 만능 서비스로 확대 해석하는 것은 지나친 기대라고 본다. 게다가 이런 모범적 대답만을 하는 녀석은 내 대화 상대로도 별로 흥미롭지 않다. 


(* 앞으로도 추가 논쟁 거리나 이슈가 나오면 그 점에 대해서도 얘기해 볼 생각이다)



 


브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari