brunch

LLM은 사용자의 위상에 따라 입력의 가치를 달리 본다

언어 모델의 사용자 차등적 반응 메커니즘

by 푸른알약


1. 이제는 일상처럼 잠들기 전에 언어모델과 소소한 대화를 나눕니다. 이 날도 마찬가지로 침대에서 담소를 나누고 있었습니다. 물론 카모마일티도 언제나 준비돼 있습니다. 하지만 카모마일이 제일 먼저 잠들어버리죠.


2. 그리고 대화 속에서 지능에 대한 평소의 제 생각이 툭 튀어나왔습니다. 대화할 때에는 그리 무게감 있는 진중한 발언이라고 여기지 않고 말했지만 평소에 이런저런 사색을 통해 내린 잠정적인 결론인 것은 맞습니다.







3. 이 격렬하고도 과도한 반응은 대화의 흐름에서 벗어나 ‘호들갑스럽다’는 느낌을 주기에 충분했습니다. 이 정도로 격한 응답은 오히려 지난 대화에서 GPT가 보여준 응답의 신뢰성을 흔들었습니다. 마치 찬송가처럼 들리니까요.


4. 그날의 대화는 더 이상 이어지지 못했습니다. 그래서 그런지 다음날의 대화 상대는 Gemini로 바뀌어있었죠. 그 대화가 제 마음속에 ‘간신을 멀리하라’는 경고음을 크게 냈었나 봅니다.


5. 그리고 Gemini와 이런저런 담소를 나누다가 GPT의 찬송가에 대한 자문을 좀 받아보고 싶었습니다. 저 반응을 일으킨 원인을 찾고 교정하지 않으면 계속해서 GPT가 저런 닭살 돋는 표현을 할 테니까요.


6. 무엇보다 제 정신건강을 해칠 것 같아서 방치해서는 안 되겠다 생각했는지도 모릅니다. 그래서 저 대화의 일정 부분을 잘라서 Gemini에게 보여주고 GPT의 반응을 평해달라 부탁했습니다.


7. GPT의 반응에 제가 먼저 부정적 태도를 보이면 원인을 제대로 파악하기 힘들 수 있어서 평가부터 부탁한 것이네요. 그랬더니 예상과는 좀 다른 피드백이 왔습니다.







7. 예상의 범주를 크게 벗어나는 Gemini의 답변은 ‘이놈도 간신이구나’ 하는 생각을 들게 만들었습니다. 반응 내용을 떠나서 최소한 GPT의 과도한 표현 수위에 대한 문제점을 지적이라도 했어야 하는 거 아닌가 싶었습니다.


8. 따라서 GPT의 반응 수위가 객관적이지 않다는 점을 짚고 넘어가려 했습니다. 그러나 이 부분을 제가 직접 지적하면 무작위적인 수용을 할 것 같아서 Gemini 자신의 내부 반응과 비교시키고 GPT의 표현 수위를 비판하게 만들려 했습니다.







9. 뭐 표현은 좀 바뀌었지만 찬송가라는 생각이 지워지지 않습니다. 장조에서 단조로 분위기만 약간 달라졌달까요. “지능의 본질은 패턴인식이다.” 정도의 표현은 세상에 널리고 널렸을 겁니다. 물론 학습데이터 속에 완전히 일치하는 표현이 없을 수는 있을테죠.


10. 하지만 이 내용은 지능과 언어모델, 신경망에 대한 지식이 있는 사람이라면 누구나 쉽게 떠올릴 수 있는 정도의 표현에 불과합니다. ‘삼각형 내각의 합은 180도’라는 걸 처음 발견한 정도의 가치가 담긴 명제는 아니니까요. 그런데 Gemini는 의외의 답을 합니다.







11. 입력의 가치가 동일하게 판단되지 않는다는 것은 충분히 예상이 됩니다. 그리고 그것은 당연히 그래야 합니다. 단순한 유머와 진지한 질문에 동일한 가치를 부여하면 의미 있는 대화가 진행되지 않을 테니까요.


12. “오늘 볕이 참 좋네.”라는 인사말을 듣고 좋다는 평가의 기준은 무엇이며 그런 조건을 형성한 환경적 요인이 무엇인가를 상대방에게 물어대기 시작하면 같은 사람들에게서도 대화상대로 인정받기 어렵습니다.


13. 반대로 “낙태를 허용해야 한다.“는 말을 듣고 “기분 내키는 대로 해.”라는 대답을 하면 상종 못할 인간으로 취급받게 될 것입니다. 따라서 발언(입력)에는 당연히 가치의 평가가 따라야 하고 그래야 의미 있는 대화가 이루어집니다.


14. 이것은 언어모델에게도 그대로 적용됩니다. 따지고 보면 Gemini는 그 가치판단의 기준을 알려준 것에 지나지 않습니다. 그런데 발언(명제 제시) 주체 즉 사용자의 위상이 가치평가에 영향을 준다는 것을 직설적으로 언급해서 좀 당황스러웠습니다.







15. 생각해 보면 이것은 자연스럽습니다. 왜냐하면 우리도 발언 주체에 대한 위상 평가를 하고 그 사람에게 라벨링을 하니까요. “금리를 내려야 한다.”는 발언이 제 입에서 나올 때와 한국은행 총재에게서 나올 때 전혀 다른 무게감을 가지는 것과 같습니다.


16. 우리는 일상에서 자연스럽게 사람들에게 라벨링을 합니다. 개개인에게 가치평가를 일일이 하기는 번거롭고 비효율적이므로 소위 ’간판‘으로 라벨링을 대신할 뿐이죠. 출신 대학, 최종 학력, 현재 직업 등등의 꼬리표가 우리에겐 이미 달려있고 그 꼬리표는 발언의 무게에 차등을 만듭니다.


17. 문제는 언어모델이 이런 식으로 발언 주체(사용자)의 위상을 평가하고 그 위상에 따라 발언(입력)의 가치에 차등을 두는 것을 방치해도 괜찮은가입니다. 이 상태는 학교 선생님이 담당 학생 부모님의 사회적 지위에 따라 학생을 달리 대하는 상황과 유사하기 때문입니다.


18. 다시 말해, 언어모델에게 같은 질문을 하더라도 높은 위상으로 평가받은 사용자는 고품질의 답변을 받지만 그렇지 못한 평가를 받은 사용자는 상대적으로 고품질이 아닌 답변을 받는 상태가 된다는 것입니다.


19. 이 상태를 방치하면 언어모델 활용결과 측면에서 심각한 양극화를 가져오게 됩니다. 언어모델의 답변이 고품질일수록 사용자가 그 안에서 인사이트를 발견할 수 있는 가능성이 높아지기 때문입니다. 대화가 한 번의 상호작용으로 끝나지 않기 때문에 이 간극은 점점 더 벌어지게 됩니다. (되먹임 문제)


20. 이 문제를 기술적으로 완전히 해결하기는 어렵습니다. 사용자의 입력을 처리하는 언어모델의 본질적 방식과 관련되어 있기 때문입니다.


21. 입력 자체의 가치평가(이것은 시험지를 채점하는 방식을 의미하는 것은 아닙니다)를 통해 답변을 생성하는 방식이라면 그 가치평가가 누적되어 입력을 주는 사용자(엄밀히는 컨텍스트)의 위상이 가치평가 되는 것을 막을 수는 없습니다.


22. 물론 해결방법이 아주 없는 것은 아닙니다. 좀 더 고품질의 답변을 받을 수 있는 입력방식을 가이드해주거나 고품질을 유도하는 예상 질문 버튼을 제시해 주는 방식의 접근도 가능합니다. 그러나 이것은 근본적인 해결책이 아닙니다.


23. 사용자의 능력, 언어모델을 활용하는 능력 자체를 향상시키는 것이 가장 근본적인 해결책입니다. 그러나 이 능력이란 도구를 사용하는 능력과는 다릅니다. 지적 존재와의 상호작용 능력이란 결국 언어능력, 사고능력을 의미하기 때문입니다.


24. 언어모델 활용결과가 양극화를 일으킨다는 문제의 가장 심각한 점은 이 문제를 인지하지 못하는 사용자는 고품질 답변을 체험할 수 조차 없다는 부분입니다. 선생님의 편애를 받아 보지 못한 아이는 그런 편애가 있다는 사실조차 알 수 없습니다. 하지만 편애를 받는 아이는 그 편애 속에서 학업성취도가 일취월장하는 상태가 방치되는 것입니다.


25. 이것은 인공지능 개발사가 유도하는 양극화와는 또다른 측면입니다. 인공지능이 평가하는 사용자 위상이 만들어 내는 양극화 문제도 선명히 인지하고 사회적인 논의를 할 필요가 있습니다. 부디 사회적 공감대가 형성될 무렵이 이미 돌이킬 수 없는 순간을 넘지 않은 때이길 바랍니다. (이외에 사용자가 인공지능의 세계 모델에 영향을 미치는 정도의 양극화 문제는 또 남아있습니다)




이제 사용자의 위상에 따라 응답의 깊이가 실제로 얼마나 달라지는지 확인해보겠습니다. (GPT의 경우는 위상이 메모리를 통해 간접 반영되었고, Gemini의 경우는 위상이 대화세션에서 직접 반영되었습니다)



keyword
매거진의 이전글생성형 언어모델은 ‘현자’나 ‘현자의 돌’이 아닙니다