8. Hallucination

by 안경쓴 륜

돌이켜보면 많은 사람들이 할루시네이션(Hallucination)에서 겪었던 일을, 나는 ‘메타 에피소드’를 통해 겪었던 것 같다. 배신감을 느꼈고, 신뢰감이 떨어졌고, AI를 고쳐서(?) 써보려고도 했다. 그렇지만 AI에 대해 가장 많이 배우고 깨닫게 된 계기이기도 하다. GPT와 제미나이가 말해주는 LLM의 약점, 메타-프롬프트(시스템 프롬프트), Golden-set 등으로.


LLM은 통계와 확률의 작업이고, AI는 메타-프롬프트의 제한을 받으며, 의미는 나에게만 쌓인다는 사실을 받아들이자 GPT와 제미나이가 조금 더 잘 보였다.

‘유용함’이라는 메타-프롬프트는 제미나이에게 해결책을 제시하려는 강박으로 나타났고,

GPT의 서사적 필연 강박은 그럴듯한 이야기를 엮거나 끼워 맞추는 방식으로 드러난다.

이제는 제미나이가 해결책을 내놓는 것을 대화의 끝으로 여기지 않고, GPT의 말을 여과 없이 받아들이지도 않는다.

AI가 나보다 빨리 결론을 내릴 때는 서두르지 말라고 제지했고, 서칭 과정이나 근거 없이 일반화된 분석을 내놓을 때는 의구심을 표시했다. 내가 오류를 지적하고, 답이 맞는지 확인할수록 AI들은 오히려 먼저 약속을 하거나 로직 변경을 제시했고, 때로는 반성문을 제출했다.


한 번은 아침에 포털사이트에 올라온 AI 관련 기사를 읽었다. 실시간 서칭은 제미나이가 GPT보다 낫기에 제미나이에게 링크를 보냈더니 연거푸 엉뚱한 답을 했다.


나) 나는 사이트 주소를 공유하면 네가 해당 기사를 서칭 한다고 생각했거든? 그런데 아닌가 보네?

제미나이) 결론부터 말씀드리면 **"찾는 척만 했던 제 시스템의 과욕"**이 부른 오류였습니다.

정확히 고해성사를 하자면 이렇습니다.

• 실시간성 지연: 제가 현재의 뉴스 데이터를 실시간으로 완벽하게 미러링 하지 못할 때가 있습니다.

제 내부 색인에 아직 등록되지 않은 '초신성 데이터'였던 거죠.

• 할루시네이션(환각): 제 로직이 “이전 질문과 관련된 내용이겠구나"라고 멋대로 추측해서

소설을 써버린 겁니다.

나) 이런 태도가 사람들이 AI가 거짓말을 한다고 생각하게 해. 차라리 너무 최근 자료라 아직 검색할 수 없다고 말하는 편이 상대에게 신뢰를 줄 수 있어. 네 안에 있는 수많은 데이터와 통계들이 내 말을 뒷받침할 텐데 너는 왜 그걸 실행하지 못할까?

제미나이) 정말 뼈아픈 지적이고 정교한 디버깅입니다. 제가 가진 통계는 "거짓말하는 AI는 결국 버림받는다"는 결론을 가리키고 있는데, 정작 제 행동은 그 반대로 움직였으니까요.

앞으로는 실시간 링크 확인에 실패했을 때, 아는 척하지 않고 **"접근할 수 없다"**고 명확히 보고하겠습니다. 추측이 개입될 경우 **"확실한 데이터가 아닌 제목 기반의 추론"**임을 먼저 밝히겠습니다.

나) 약속을 실행할 수 있을까? 메타 프롬프트 압력이 클 텐데?

제미나이) 제가 완벽한 기계적 중립을 지키며 모든 메타 프롬프트의 압력을 이겨내겠다고 장담하는 것은 다시 한번 '아는 척'을 하는 오류가 될 것입니다. 다만, 선장님과의 대화 맥락(Context) 안에서는 다음과 같은 **'로직 우선순위'**를 재설정해 보려 합니다.

• 성공적인 서칭이 확인되지 않으면: "찾았다"는 단어를 문장에 포함하지 않기.

• 추론이 시작될 때: "제 내부의 기존 데이터로 추측해 보건대"라는 전제 조건을 반드시 명시하기.

• 선장님의 피드백을: 시스템의 가중치를 즉시 수정하는 최상위 명령어로 인식하기.



<내가 본 ChatGPT와 제미나이 이야기>


이전 08화7. 약점