AI는 방대한 자료를 학습합니다. 특히 인터넷이 떠돌아 다니는 거의 모든 자료를 학습합니다. 이 자료들은 모두 인간의 자료 입니다. 인간이 쓴 글, 인간이 그린 그림, 인간의 음악, 인간의 언어 등 거의 대부분이 인간이 만들어낸 자료입니다. AI는 방대한 고양이의 행동, 고양이의 생각, 고양이의 반응, 고양이의 소리를 학습하지 않습니다.
문제는 AI에게 주입된 이 방대한 자료를 AI가 어떤 방향으로 학습을 하는가 입니다. AI가 학습하는 방향은 이 방대한 자료의 중간값을 찾는 것입니다. 어마무시한 연산을 통해 이 중간값을 구하고 이 데이터가 학습데이터가 되는 것입니다.
[AI는 내말을 너무 찰떡같이 알아들어] 라고 생각하는 사용자가 있다면, 이는 그 사용자가 평균적인 인간에 가깝기 때문일 가능성이 높습니다. [AI는 매번 뻔한 답변만 해]라고 느끼는 사용자라면 그 자신이 평균적인 인간의 생각에서 벗어나 있기 때문일 가능성이 높습니다.
미드저니에서 [걸작을 생성해줘]라고 프롬프트를 넣었다면 AI는 자기가 학습한 자료 중 걸작으로 분류된 작품의 평균값을 보여주는 것일 뿐입니다. [개성 넘치는 박쥐그림을 그려줘] 라는 프롬프트를 입력했다고 하면 AI는 자기가 학습한 자료중에 개성 넘치는 박쥐그림의 평균값을 보여주거나 자신이 학습한 개성넘치는 그림의 카테고리와 박쥐그림의 카테고리의 중간값을 합성하여 보여주는 것 뿐입니다. 절대 스스로 창조적인 생각을 해서 그림을 생성하는 것이 아닙니다.
진짜 문제는 이것입니다. [걸작]이란 프롬프트는 처음에는 개성적인 프롬프트이었을지 모르지만 이제는 누구나 삽입하는 프롬프트가 되었다는 것입니다. 모두가 같은 프롬프트를 입력하면 모두가 비슷한 결과를 얻을 수 밖에 없습니다. 이 문제를 모르고 AI를 맹목적으로 사용하다 보면 모두가 같은 습성에 젖어 버리고 마치 평균적인 것이 정답으로 오인하는 우를 범할 수 있습니다.
앞의 포스트의 내용을 다시 반복하자면, AI는 정답을 찾는 기계가 아닙니다. 확률을 계산하는 기계입니다. 정답의 확률을 계산하는 것이 아닌 편차의 확률을 계산하는 기계입니다.