brunch
매거진 글밭

인공지능을 어떻게 쓸 것인가

평가 도구가 필요하다

by 김세중

불완전한 인간, 더 불완전한 AI < 김홍열의 디지털 콘서트 < 오피니언 < 기사본문 - 미디어스


인터넷에서 눈에 확 띄는 글을 접했다. 제목부터 신선했다. "불완전한 인간, 더 불완전한 AI"였다. 글을 읽어내려가면서 왜 인공지능이 환각(hallucination)을 곧잘 일으키는지를 좀 더 잘 알 수 있었다. 현재 유통되는 텍스트가 불완전하다는 것 그리고 검증 시스템이 없다는 것이 큰 이유였다. 진실을 말하기보다 "그럴듯한 응답"을 작성하도록 훈련되었기 때문이라는 설명도 있었는데 이건 좀 알듯말듯했다. 진실은 어차피 누구도 모르는 게 많지 않은가.


그럼 그럴듯한 응답을 하도록 누가 훈련시키나. 아니, 그럴듯한 응답이 도대체 뭔가. 믿고 싶은 충동을 느끼는 게 그럴듯한 응답일까. 어쨌든 내가 접한 인공지능은 "그건 잘 모릅니다." 하고 대답하는 걸 별로 보지 못했다. 물론 "개인적 신상에 관한 사항이니까 답변할 수 없습니다." 하는 적은 있다. 인공지능은 뭐든 잘 아는 양 넙죽넙죽 잘 대답을 내놓는데 알고 보면 전혀 사실과 다른 엉뚱한 말을 마구 지어내는 경우가 너무나 흔하다. 얼토당토않은 말을 마구 쏟아내는 것이다.


챗gpt가 세상에 나온 지 딱 2년 반이 지났다. 그 사이에 숱한 생성형 인공지능이 탄생했다. 지금도 어딘가에서 출현을 준비하고 있을 것이다. "불완전한 인간, 더 불완전한 AI"의 마지막 문장은 "AI의 답변을 선택적으로 이용해야 하는 이유다."인데 그 선택을 어떻게 할 것인가가 문제다. 어떤 답변은 수용하고 어떤 답변은 배척하라는 건데 그걸 각 개인이 무슨 수로 할 거냐 말이다.


그래서 숱한 인공지능이 앞으로 경쟁할 텐데 이들의 정확도, 신뢰도를 평가할 믿을만한 도구가 등장해야 할 것 같다. 인공지능을 비교, 평가할 도구 말이다. 그래야 사람이 인공지능의 홍수 속에서 방황하지 않고 슬기롭게 이를 이용할 수 있지 않을까. 그런 게 나오기 전까지 나는 스스로 나름대로의 평가 척도를 만들어볼 생각을 하고 있다. 인공지능에 당하지 않기 위해서.

keyword
매거진의 이전글표준어란 무엇인가