음성모드 개발의 본질적 한계
챗GPT 텍스트 모드를 가르치고 조련하려고 오랫동안 노력해 왔다.
답답함은 사용자의 몫이다.
챗GPT 음성모드는 그 정도가 더 심하다.
그 이유는 음성모드의 강점에서 온다.
챗GPT는 자연스럽고 편안한 마치 사람과 대화하는 것 같은 방향성으로 개발되고 있다.
그래서,
텍스트모드보다 수준이 떨어지며
프롬프트를 저장해도 정확도가 낮아질 수밖에 없다.
이건 사실
실시간 음성 해석 모델의 파라미터 크기의 제약
응답 속도 유지 때문에 GPT 텍스트 모델보다 경량화된 모델의 사용
텍스트를 음성으로 변환하면서 "자연스럽고 편안한" 대화로 바뀌는 과정에서 자료의 손실
맥락 유지의 어려움
이러한 기술적 한계에서 기인한다.
그러니, 장점은 단점이고 단점은 장점이다.
어느 순간에는 정확한 개발의 방향에 따른 타기팅 사용자의 범위가 선명해질 것이라 생각된다.
그때가 언제가 될지는 모르지만,
상당히 답답한 상태는 지속될 것으로 보인다.