Opus 4.7 뭐가 달라졌을까?
안녕하세요, 개발빔입니다!
드디어 Claude Opus 4.7이 정식 출시됐습니다.
2026년 4월 16일자로 릴리스됐는데요!
Anthropic은 매번 혁신을 보여주는 회사라서,
이번 Opus 4.7 업데이트 소식도 기대를 안 할 수가 없었습니다ㅎㅎ
소식 듣자마자 공식 발표 자료를 쭉 훑어봤는데요,
어떤 점이 달라졌는지, 실무 개발자 입장에서 챙겨야 할 포인트가 뭔지
오늘 깔끔하게 총정리해드리겠습니다~
이번 업데이트에서 Anthropic이 제일 강조하는 키워드가 자율성입니다.
복잡하고 긴 작업을 스스로 결과를 검증하면서 완수한다는 점을 전면에 내세웠습니다.
공식 발표 문구 그대로 옮기면,
이전에는 개발자가 옆에서 감독해야 했던 난이도 높은 코딩을
이제는 맡기고 믿을 수 있는 수준이라고 표현합니다.
두 번째 키워드는 시각 지능입니다.
장축 기준 2,576픽셀, 약 3.75메가픽셀까지 이미지를 받습니다.
기존 클로드 모델 대비 3배 수준입니다.
Anthropic은 이미지 한 장만으로도
고품질 UI 시안이나 슬라이드를 뽑아내는 수준이라고 설명합니다.
공식 차트를 보면 코딩 관련 벤치마크 개선이 눈에 띕니다.
SWE 벤치 프로에서 Opus 4.6이 53.4%였던 게 4.7은 64.3%로 올랐습니다.
터미널 벤치 2.0은 65.4%에서 69.4%, SWE 벤치 검증판은 80.8%에서 87.6%입니다.
커서 자체 벤치마크인 커서벤치에서는 58%에서 70%대로 올라왔다고 합니다!
GPQA 다이아몬드에서 91.3%가 94.2%로 올랐고,
비주얼 추론은 69.1%에서 82.1%로 확 뛰었습니다.
에이전트 파이낸셜 분석은 60.1%에서 64.4%입니다.
전반적으로 10~15% 수준의 개선이 대부분입니다.
공식 발표 주석에 흥미로운 내용이 있습니다.
Anthropic이 Opus 4.6의 사이버짐 점수를
기존에 발표했던 66.6점에서 73.8점으로 다시 수정해놨습니다.
측정 방식을 개선해서 재측정했다는 설명인데요,
결과적으로 4.6과 4.7 사이 점수 격차가 원래 발표보다 좁아진 셈입니다.
신형이 잘 나왔다고 말하려고 구형 점수를 조정하는 건 AI 업계에서 종종 보이는 일이긴 합니다 ㅎㅎ
그래서 벤치마크 숫자만 보고 바로 판단하지 마시고,
이런 조정 이력까지 같이 확인하시는 걸 추천드립니다!
공식 벤치마크 표를 보면 재밌는 포인트가 있습니다.
표 맨 오른쪽에 미토스 프리뷰가 같이 들어가 있는데,
대부분의 항목에서 Opus 4.7보다 높은 점수입니다.
SWE 벤치 프로는 77.8%, 비주얼 추론은 93.2%입니다.
Anthropic도 공식 글에서 미토스 프리뷰보다는 범용 성능이 떨어진다고 직접 언급합니다.
결국 Opus 4.7은 중간 정비 모델이고, 진짜 플래그십은 미토스라는 이야기입니다.
Opus 4.7을 학습시키면서 사이버 보안 관련 역량을 일부러 낮추는 실험까지 했다고 밝혔습니다.
미토스급을 본격 배포하기 전에 Opus 4.7로 먼저 검증한다는 의미입니다.
제일 먼저 체감되는 부분입니다. Opus 4.7은 지시사항을 문자 그대로 받아들입니다.
Anthropic도 공식적으로 기존 프롬프트가 예상치 못한 결과를 낼 수 있으니
재조정이 필요하다고 안내했습니다!
저는 기존 코드 리뷰 프롬프트를 그대로 사용해봤습니다.
4.6에서는 알아서 넘기던 디테일을 4.7은 전부 따지고 들었습니다ㅠㅠ
좋기도 하고 피곤하기도 합니다.
기존 프롬프트 쓰시는 분들은 반드시 테스트가 필요하실 것 같습니다~
실제로 UI 시안 뽑기나 슬라이드 초안 만들기 같은 작업에 써보면 4.6보다 결과물이 정돈돼 있습니다.
디자인 감각이 좋아졌다는 피드백이 Anthropic 공식 사용자 인터뷰에도 여러 번 나옵니다.
대시보드나 데이터 시각화 화면 프로토타입 작업에는 꽤 유용하실 겁니다.
이 부분이 저한테는 제일 좋다고 느껴졌는데요!
긴 호흡의 에이전트 워크플로우에서 중간에 맥락 놓치는 빈도가 줄었습니다.
레거시 코드 마이그레이션을 시키면서 테스트해봤는데,
4.6 대비 방향 헤매는 경우가 확실히 적었습니다~
클로드 코드에 울트라리뷰가 새로 생겼습니다.
시니어 개발자가 리뷰 돌리듯이 변경사항을 꼼꼼히 읽고
버그와 설계 이슈를 짚어내는 전용 리뷰 세션입니다.
프로와 맥스 사용자한테 무료 3회 제공됩니다!
PR 하나 돌려봤는데 일반 리뷰보다 놓치기 쉬운 부분을 잘 짚더라고요ㅎㅎ
기존 하이와 맥스 사이에 엑스하이 레벨이 새로 생겼습니다.
클로드 코드에서는 모든 플랜 기본값이 엑스하이로 상향됐습니다.
세밀한 조절이 필요한 분들한테는 반가운 옵션이지만 대부분은 기본값 쓰셔도 됩니다.
API 쪽에는 태스크 버짓이 퍼블릭 베타로 나왔습니다.
긴 실행 작업에서 토큰 소비를 개발자가 미리 가이드할 수 있는 기능입니다.
에이전트 운영하는 팀이라면 비용 예측 측면에서 챙겨볼 만합니다.
이번 Opus 4.7는 사실 기대와는 다르게 큰 변화는 없었습니다.
미토스라는 다음 세대를 본격 출시하기에 앞서,
주력 Opus 라인을 한 번 더 다듬은 소수점 업데이트로 보입니다.
AI 모델 업데이트는 앞으로도 빠른 템포로 계속 나올 겁니다.
새로운 소식이 들리면 또 빠르게 공유드리겠습니다!