AI는 생각하지 않는다?

컨텍스트는 무엇인가? 그리고, 추론과 AI에 대한 몰이해...

by 신현묵
image.png

이런 글이.. 페이스북에 올라와서.. 누가 올린것인지는 슬쩍 뺴고.. 그냥, 몇가지 의견 끄적거려본다.


먼저, AI는 쓸모없는 것일까?


확률적 패턴 매칭에 대해서 잘 이해하고 쓴 글일까?라고 생각해본다. 단편적으로 보면, 애플의 실험은 Edge case로 그 능력의 한계가 명확하다는 것이고, AI는 단순한 암기가 아니라, 변형 문제에 대응하는 가능성을 증명했다는 식으로 해석이 되기도 한다.


두번째, 다섯개는 조금 작았다라는 문장에 낚인 AI가 문제이기는 하지만, LLM의 특성이 사실 그래서, 조금은 더 단순한 문장으로 다루는 것이 효과적이라는 것은 요즘 CLI다루는 사람들의 공통의견이기도 하다.


사실, 인간도 복잡한 문제속에 헛점이 있거나 함정이 있으면 실수하고, 인간들은 그러한 시험을 자주 본다. 특히, 대한민국 수능의 비비꼬운 변태스러운 문제들은 더더욱 그런듯.. ㅎㅎ


LLM의 기준은 입력된 모든 단어를 거의 동일한 우선순서나 중요도로 평가하도록 설계 되어 있다는 것을 잊지 말자. 그래서. 불필요한 정보도 중요하게 여기면서, 의도하지 않은 결과물을 만들어낸다는 것 역시 잊지 말자.


요즘 CLI를 많이 사용하는 사람들은 그래서, 더더욱.. 문장을 비비꼬지 않고, 평이하게 만들고, 이를 통해서 AI와 대화한다. 어찌본다면, AI를 잘 이해하고, 그들과 대화하는 방법을 터득했다고 해야할까?


마치 저 실험은.. 비비꼬인 사람이, '너 정말 능력있는지 한번 확인해볼까?'라는 고약한 장난에 대해서, 전공 바보들이 실수한 것 과 같은 결론 아닐까?


세번째. 애플이 실험한 GSM8K는.. 사실, 초등학교 수준의 문장제 문제라는 것을 잊지 말자는 것이다. 그냥, 인간의 암기를 위해서 준비된 문장들이고, 단순 패턴 매칭에 대한 검증 방법이라고 생각하면 너무 큰 오해일까?


요즘 트랜드를 보면, AI모델들을 만드는 사람들 대부분이 알고 있어서, 'System 2 Thinking(천천히 생각하기)'방식을 도입하는 것도 유행이라는 것을...


OpenAI의 o1모델은 스스로 풀이 과정을 재검토하는 단계를 포함하고 있고, 능숙하게 AI를 사용하는 사람이나 집단들은 이러한 파이프라인들을 대부분 사용하고 있다. 왜? 인간들이 그러하니깐..


모든 업무들은 검증 및 확인, 테스트 단계를 거쳐서 실제 사용되니까.. 그 방법을 그대로 대부분 사용한다. 현재 급하게 AI를 사용하거나 맹신하는 경우에 이런 실패 사례를 꽤 많이 접한다는 것이다.


이제, AI는 단단한 논리구조로 잘 설계된 곳에서는 엄청난 결과물들을 뽑아내고 있으니, 결국.. 어떻게 이러한 AI 파이프 라인을 잘 구축하느냐의 싸움으로 현재는 비즈니스 환경이 변화하고 있다는 것이다.


뭐..


하지만..


이런 애플의 실혐과 연구는.. 자기들이 실패한 AI의 주도권에 대한 딴지 걸기라는 것에 한표이고, 두번째는 비판적 사고없이 AI의 답변을 그대로 사용하는 바보들에 대한 경고로 읽혀지면 도;ㅂ니다.


하지만...


'생각하지 않으므로 가치없다'는 것은 정말 위험하다고 정리하고 싶습니다.


AI는 인간과 다른 방법으로 문제를 해결하고 있으니,

어떻게 인간과 조화롭게 구조를 만들고,.

인간이 개입해야 하는지에 대한 진정한 문제를 던져주고 있는것 아닌가 합니디.


이제 AI는 인간의 곁에서, 더 많이 진보된 역할을 하는 도구가 될것입니다.

매거진의 이전글Claud Code, 2월 이후 품질저하..