어떤 모델이 사용하기 제일 좋을까?
Cursor AI를 이용해서 이런저런 것을 만든지 한달이 넘게 지난듯 하다.
해당 툴을 이용하면 기존에는 하지 못했던 것을 손쉽게 구현할 수 있는 장점이 있는데,
불러다 쓰는 Large Language Model(LLM, 대형언어모델)에 따라 성능이 천지차이다.
아래는 퍼플(퍼플렉서티)이 알려주는 Top 5 모델인데, 아직 Claude 4가 나오기 전 데이타인듯하다. 개인적으로 써보니, Claude 4 성능은 3.5, 3.7보다 월등하게 좋았다. Junior SW Engineer급은 이미 넘어선듯하다.
너무 자주 써서인지, 다른 사람들도 많이 써서인지 해당 모델이 추가로 돈을 내는 사람들에게만 오픈이 되고 있다. 그래서 다른 모델 중 어떤 것을 쓰면 좋을까 하고 이거저거 살펴봤는데, 간단한 소감을 공유하면...
Gemini-2.5-Pro : 매우 수다장이이다. 정말 말이 너~~~무 많다. 이렇게 설명이 많다니... 눈이 피로하다
DeepSeek V3.1 : 빠르다! 아무래도 다른 사람들이 잘 안써서 인지 모르겠지만, 뭘 자꾸 시킨다. 이거 못고치니 네가 고쳐라. 나는 못한다 등등
GPT-4o : 무난하다.
그런데 공통된 단점이 있다면, 혼자서 실행을 못하고 계속 사용자에게 실행하고 로그 긁어다가 알려달라고 한다. 아니, 그러면 내가 왜 커서 툴을 쓰나?
Claude는 그러거 없이 알아서 다 해주는 맛집인데 말이다.
그래서, 4.0을 못쓰고 있는 나는, 울며겨자먹기로 3.7을 사용중에 있다.
이녀석도 성능이 좋기는 하지만, 가끔 엉뚱한 짓을 해서, github에 커밋을 안해놓았을 때 코드가 다 꼬이게 만들기도 한다(제발 깃헙 쓰세요!).
이만 간단한 코멘트 끝!