이전에는 심심할 땐 챗GPT를 많이 가지고 놀았는데, 요즘은 구글에서 만든 제미나이(Gemini)와 중국에서 만든 디프시크(DeepSeek)도 자주 사용하고 있다. 챗GPT의 경우 무료 버전에는 사용에 제한이 있었는데, 제미나이나 디프시크에서는 그런 것이 없이 얼마든지 사용할 수 있어 좋다. 게다가 품질도 오히려 챗GPT에 비해 나은 것 같다. 그래서 요즘은 챗GPT는 그다지 사용하지 않는 대신 제미나이와 디프시크를 집중적으로 사용하고 있다.
작년 유럽 여행을 할 때 챗GPT를 많이 사용했다. 주로 어떤 도시에 도착해서 어떤 관광 스폿이 있는지, 그리고 어떤 경로로 둘러보면 가장 효율적인지 알기 위해서였다. 챗GPT는 관광 스폿을 추천해 주는 데는 뛰어나지만, 최적 경로를 만드는 데는 무척 취약하다. 처음에는 챗GPT가 추천하는 경로로 따랐으나, 나중에는 이것이 완전 엉터리라는 사실을 알고 그만두었다. 알고 보니 우리가 현재 사용하는 컴퓨터 자체가 최적경로를 도출하는 데는 아주 서툴다고 한다. 현재 개발 중인 “양자 컴퓨터”가 이러한 부분에 탁월한 성능을 발휘한다고 한다.
제미나이와 디프시크를 이용해 보니 기대보다 아주 좋다. 특히 올 가을에 중국여행을 계획하고 있어 디프시크를 이용하여 여행계획을 만들고 있는데, 아주 풍부한 정보를 제공해주고 있어 좋다. 제미나이 역시 여러 질문을 해보면 챗GPT에 비해 훨씬 풍부하고 자세한 대답을 해준다.
그러다가 갑자기 한 생각이 떠올랐다. 챗GPT와 제미나이 그리고 디프시크에게 누가 제일 훌륭한가를 물으면 어떻게 생각할까? 사람들이라면 아마 자신이 제일 잘한다고 나설 것이다. 그러면 인공지능은 어떨지 한번 물어보기로 했다. 그래서 일단 다음과 같은 두 가지 문제로 테스트해 보기로 했다.
(1) 원주율을 소수점 이하 백만 자리까지 계산하라.
(2) 어느 도시에 있는 10개의 관광지를 도보로 둘러보려고 한다. 최적의 경로를 만들어달라.
먼저 문제(1)에 대해서는 세 인공지능 모두가 AI는 계산기가 아니므로 이를 계산할 수 없다는 취지의 대답을 해왔다. 그래서 이번에는 소수점 1만 자리 이하로 조건을 완화해서 다시 대답을 물었다. 그랬더니 다음과 같은 답이 나왔다.
• 챗GPT: 셋 모두 계산을 실제로 수행하는 능력은 없다. 사전에 학습된 일부 값을 제공하거나 방법을 알려주는 수준이다. 각각 답을 찾는 방법은 있는데, 굳이 순위를 따진다면 ① 챗GPT, ② 제미나이 ③ 디프시크 순서이다.
• 제미나이: 셋 모두 계산을 실제로 수행하는 능력은 없다. 그러나 필요한 정보나 코드를 제공해 줄 수 있다는 면에서 본다면 디프시크나 챗GPT가 유용하다. ① 챗GPT, ① 디프시크, ② 제미나이 순서이다.
• 디프시크: 원주율 1만 자리 계산은 디프시크는 가능하며, 챗GPT는 유료만 가능, 제미나이는 불가능하다. 디프시크는 유료 챗GPT에 비해 속도도 2~3배 빠르다. 그러므로 순서는 ① 디프시크, ② 유로 챗GPT, ③ 제미나이 순서이다.
다음으로 문제(2)에 대해서는 각각 다음과 같이 답을 하였다.
• 챗GPT: 경로 최적화 알고리즘은 챗GPT가 최강이며, 내장지도 활용면에서는 제미나이가 뛰어나다. 전체적인 순서로는 ① 챗GPT, ② 제미나이이며, 디프시크는 형편없는 수준이다.
• 최적 경로를 찾는 데는 정확한 지리 데이터의 접근 등의 강점을 가진 제미나이가 가장 낫다. 챗GPT는 이론적 계산방법을 제시할 수는 있지만, 데이터를 기반으로 실제 거리를 계산하는 능력은 제한적이다. 이 점에서는 디프시크도 마찬가지이다. 결국 ① 제미나이, ② 챗GPT ② 디프시크이다.
• 디프시크: 한국어 이해도, 여행경로 이해도, 실시간 장소 데이터, 도보특화 정보 등 모든 면에 걸쳐 디프 시크가 탁월하다. 나머지 둘을 비교한다면 한국어 이해도와 여행경로 최적화, 도보 특화 정보에 대해서는 챗GPT가 나으며, 실시간 장소 데이터에 있어서는 제미나이가 낫다. 그래서 종합적으로는 ① 디프시크, ② 챗GPT(유료), ③ 제미나이 순서이다.
나로서는 세 인공지능 가운데 어느 것이 가장 나은 지는 판단하기 어렵다. 그런데 각 인공지능의 대답을 보면 제미나이가 상대적으로 겸손한 편이고, 자긍심은 디프시크가 가장 높은 것 같다. 챗GPT도 자신이 최고라는 생각을 가진 듯하다. 인공지능도 사람들과 마찬가지로 지기 싫어하는 마음을 가졌나 하는 생각이 든다.