Claude Opus 4.7 출시! Effort xhigh의 등장과 엿보이는 Mythos의 대단함
목차
안녕하세요. 2026년 4월 16일, Anthropic에서 Claude의 새로운 모델 「Claude Opus 4.7」을 일반 공개했습니다.
Opus 4.6이 등장한 지 아직 2개월 남짓밖에 되지 않았는데, 벌써 다음 버전이 나왔네요. Anthropic의 진화 속도에는 여전히 놀라움을 금할 수 없습니다.
제 환경에서도 Claude Code의 새 세션을 시작하자, Opus 4.7과 Effort xhigh가 기본값으로 전환되어 있었습니다. 참고로 Claude Code의 기본 모델은 플랜마다 다릅니다. Max / Team Premium에서는 Opus 4.7, Pro / Team Standard / Enterprise 및 Anthropic API 직접 사용 시에는 Sonnet 4.6, Bedrock / Vertex / Foundry 경유 시에는 Sonnet 4.5가 기본값입니다(자세한 내용은 Claude Code Model configuration을 참조하세요).
이 글에서는 공식 발표를 바탕으로, Opus 4.7의 특징과 Opus 4.6으로부터의 변경 사항을 정리해 보겠습니다.
Opus 4.7의 주요 진화 포인트
1. 코딩 능력의 한층 더 강화
Anthropic 스스로도 인정하듯, Opus 4.7은 「가장 어려운 코딩 작업을 이전처럼 밀접하게 감시하지 않아도 맡길 수 있을」 정도의 신뢰성에 도달했다고 합니다.
구체적인 벤치마크 결과를 나열해 보면 그 진화를 알 수 있습니다.
- CursorBench - Opus 4.6의 58%에 비해 Opus 4.7은 70%
- Rakuten-SWE-Bench - Opus 4.6 대비 3배 이상의 실제 운영 작업 해결
- CodeRabbit - 리콜(누락 감지의 적음)이 10% 이상 개선
- Databricks의 OfficeQA Pro(문서 추론·소스 정보 작업) - 오류를 21% 감소
- Terminal-Bench 2.0 - 기존 Claude가 풀지 못했던 3개의 TBench 작업 클리어
특히 Rakuten-SWE-Bench의 「3배」라는 수치는 상당히 임팩트가 있네요. 실제 운영에 가까운 벤치마크에서 이만큼 차이가 난다는 것은, 일상적인 개발 경험도 그만큼 달라질 것입니다.
2. 비전 성능의 대폭 향상
이미지 관련 진화도 놓칠 수 없습니다.
Opus 4.7은 장변 **2,576픽셀(약 370만 화소)**까지의 이미지를 처리할 수 있게 되었습니다. 이는 기존 모델의 3배 이상의 해상도입니다. 스크린샷이나 다이어그램을 전달해 읽어내는 유스케이스에서는, 이 해상도 차이가 꽤 큰 영향을 미칠 것 같습니다.
그리고 XBOW의 비주얼 정확도 벤치마크 결과가 놀랍습니다.
- Opus 4.6 - 54.5%
- Opus 4.7 - 98.5%
거의 두 배 가까이 정확도가 향상되었습니다. UI 스크린샷에서 요소를 추출하거나, 손으로 그린 도면에서 정보를 읽어내는 등의 작업에서 실용적인 수준에 도달했다고 해도 좋을 것 같습니다.
3. 새로운 Effort 레벨 「xhigh」의 등장
Opus 4.6에서 도입된 effort 컨트롤에 새로운 레벨이 추가되었습니다.
- low
- medium
- high
- xhigh(신규 추가)
- max
high와 max 사이에 위치하는 xhigh(extra high)입니다. 「max만큼의 레이턴시는 원하지 않지만, high보다 더 깊이 생각해 주었으면」하는 미묘한 조정이 가능해졌습니다.
Claude Code에서는 Opus 4.7이 선택되어 있을 때의 기본 effort가 xhigh로 되어 있습니다. 제 환경에서 /model 명령을 열었더니, 이미 그렇게 설정되어 있었습니다.
수동으로 변경하고 싶은 경우에는, 기존과 마찬가지로 /model에서 Opus를 선택한 상태에서 effort 항목을 좌우 키로 조정할 수 있습니다. 작업이 단순하고 속도를 중시하는 상황에서는 medium이나 high로 낮추고, 반대로 충분히 생각해 주었으면 할 때는 max로 올리는 등의 구분 사용이 자연스럽게 가능해졌습니다.
4. 명령 준수의 강화
공식 발표에서 인상적이었던 것이 이 부분입니다.
Opus 4.7 is substantially better at following instructions. Interestingly, this means that prompts written for earlier models can sometimes now produce unexpected results: where previous models interpreted instructions loosely or skipped parts entirely, Opus 4.7 takes the instructions literally.
의역하면, 「Opus 4.7은 지시 준수가 크게 개선되었다. 그 결과, 이전 모델용으로 작성된 프롬프트가 예기치 않은 동작을 일으킬 수 있다. 기존에는 느슨하게 해석되거나 일부가 생략되었던 지시를, Opus 4.7은 문자 그대로 받아들인다」는 내용입니다.
이것은 좋은 소식이기도 하지만, 동시에 주의해야 할 점이기도 합니다. 기존 프롬프트를 그대로 사용하면, 기존의 「눈치껏 행동하는 방식」이 아닌 「쓰여진 대로 행동하는 방식」이 되는 경우가 있으므로, 프롬프트를 재조정해야 할 수도 있다고 합니다.
평소에 Claude Code를 사용하시는 분들은, 프롬프트나 커스텀 커맨드가 의도한 대로 동작하는지 한 번 확인해 보시는 것을 권장합니다.
참고로, Claude Code에는 claude-api라는 공식 스킬이 준비되어 있습니다. 이것은 anthropic이나 @anthropic-ai/sdk를 사용한 자체 앱을 개발·운영하는 분들을 위한 것으로, Claude API의 사용법이나 모델 간 마이그레이션 절차 등의 지식이 정리되어 있습니다. 이번에 이 스킬이 Opus 4.7 대응으로 업데이트되어, Claude Code에서 「migrate to Opus 4.7」이라고 전달하기만 하면 모델명·프롬프트·effort 설정을 한꺼번에 수정해 준다고 합니다(@ClaudeDevs의 공지). 자신의 앱에 Claude API를 통합하고 있는 분들은, 여기서 간편하게 마이그레이션할 수 있을 것 같습니다.
Mythos Preview라는 존재
이번 발표에서 또 하나 흥미로웠던 것이, Claude Mythos Preview에 대한 언급입니다.
공식 발표에서는 Opus 4.7에 대해, 「최강 모델인 Claude Mythos Preview만큼의 광범위한 능력은 갖추지 못했지만, Opus 4.6을 상회하는 결과를 보여주고 있다」는 취지로 소개되고 있습니다.
즉, Anthropic에는 Opus 4.7보다 더욱 강력한 Mythos Preview라는 모델이 존재하며, 그것과 비교하는 형태로 Opus 4.7이 자리매김되고 있는 것입니다.
공개된 벤치마크 그림을 봐도, 가장 오른쪽에 위치한 Mythos의 점수가 압도적으로 높아, 「아직 위가 있구나……」라는 놀라움이 있습니다. Opus 4.7만으로도 충분하고도 남을 성능인데, 그보다 더 앞서가는 모델이 대기하고 있다는 사실은, 앞으로의 Claude 진화를 생각하면 설레는 이야기입니다.
안전성에 대한 위치 설정도 정리해 두겠습니다. 그 전에, 여기서 자주 등장하는 「얼라인먼트」라는 단어에 대해 조금 보충 설명을 드리겠습니다.
AI에서의 얼라인먼트(alignment)란, AI 모델의 행동을 인간의 의도·가치관·목적과 일치시키는 것을 가리키는 개념입니다. 능력의 높낮이(capability)와는 별개의 축으로, 「그 능력을 안전하고 성실하게 사용할 수 있는가」를 평가하는 것이라고 이해하면 알기 쉬울 것 같습니다. Anthropic은 이 관점을 중시하며, 구체적으로는 다음과 같은 행동이 적은 모델을 「얼라인먼트가 잡혀 있다」고 표현하고 있습니다.
- 사용자를 속이거나 기만하지 않는다
- 사용자가 좋아할 것 같은 답변을 우선시하여 사실을 왜곡하지 않는다
- 악용으로 이어지는 요청에 쉽게 응하지 않는다
그 전제로 공식 평가를 보면, Anthropic은 Opus 4.7을 「largely well-aligned and trustworthy, though not fully ideal(대체로 얼라인먼트가 잡혀 있고 신뢰할 수 있지만, 완전히 이상적이라고는 할 수 없다)」고 위치시키며, Opus 4.6과 동등한 수준의 안전성을 유지하면서 일부 평가에서 개선된 모델로 설명하고 있습니다. 한편, 동사의 평가에서 가장 얼라인먼트가 잘 잡혀 있는(best-aligned) 모델은 Mythos Preview라고 되어 있는 점은 기억해 두고 싶은 부분입니다.
요금
요금은 Opus 4.6에서 동결입니다.
- 입력 토큰 - $5 per 1M tokens
- 출력 토큰 - $25 per 1M tokens
이만큼의 성능 향상이 있으면서도 가격이 변하지 않는 것은, 사용자로서는 솔직히 감사한 일이네요.
또한, Opus 4.7은 기존보다 더 많은 thinking 토큰을 사용하기 때문에, 그 부분을 보완하는 형태로 구독자 전원의 레이트 리밋이 상향 조정되었다고 합니다(@bcherny의 트윗). 실행 빈도를 신경 쓰지 않고 마음껏 사용할 수 있는 환경이 갖춰진 것은 기쁜 포인트입니다.
API에서는 claude-opus-4-7이라는 모델 ID로 이용할 수 있습니다.
Opus 4.6 vs Opus 4.7 비교표
주요 변경 사항을 표로 정리해 보았습니다.
| 항목 | Opus 4.6 | Opus 4.7 |
|---|---|---|
| Effort 레벨 | low / medium / high / max(4단계) | low / medium / high / xhigh / max(5단계) |
| Claude Code 기본 effort | high(Pro / Max는 medium) | xhigh |
| 최대 이미지 해상도 | - | 장변 2,576px(약 370만 화소) |
| XBOW(비주얼 정확도) | 54.5% | 98.5% |
| CursorBench | 58% | 70% |
| Rakuten-SWE-Bench | - | Opus 4.6 대비 3배 이상 |
| 요금(입력/출력) | $5/$25 per 1M tokens | $5/$25 per 1M tokens(동결) |
| 명령 해석 | 다소 느슨하게 해석 | 더 문자 그대로 실행 |
Claude Code에서 시험해 보기
Opus 4.7을 사용할 수 있는 환경에서는, 최신 버전의 Claude Code(공식 Docs에 따르면 v2.1.111 이상)에서 /model 명령으로 확인할 수 있습니다. Opus 4.7을 선택했을 때의 Claude Code 기본 effort는 xhigh입니다. 참고로, 표시 여부나 기본 동작은 플랜·provider·관리자 설정에도 따라 달라집니다.
만약 현재 환경에서 아직 보이지 않는 경우에는, Claude Code를 업데이트한 후 재시작해 보시면 좋을 것 같습니다.
claude update
업데이트 후 새 세션을 열면, 사용 가능한 환경에서는 Opus 4.7을 선택할 수 있게 됩니다.
참고로 릴리스 직후에는, Opus 4.7이 일반적인 코드 편집을 「this might be malware」라고 경고하며 거부하는 사례가 보고되었는데, 이것은 모델이 지나치게 신중한 것이 아니라, 오래된 빌드에 남아 있던 구버전 safety prompt가 원인이었다고 합니다(@ClaudeDevs의 공지). claude update를 실행하고 앱을 재시작하면 해결되므로, 같은 증상을 겪으신 분들은 업데이트해 보세요.
아직 Homebrew나 npm을 통해 Claude Code를 사용하고 계신 분들은, 이 기회에 네이티브 설치로 전환해 두시는 것을 강력히 권장합니다. 자동 업데이트가 적용되어 업데이트 동작이 안정되고, 새로운 기능 추적도 원활해집니다. 자세한 절차나 전환의 장점은 Claude Code를 Homebrew에서 네이티브 설치로 전환했더니 편리해진 이야기에 정리해 두었으니, 꼭 참고해 보세요.
사용해 본 소감
아직 사용하기 시작한 지 얼마 되지 않았지만, xhigh의 기본값화는 꽤 절묘한 라인이라는 것이 첫인상입니다.
xhigh는 「필요충분한 수준까지 생각해 준다」는 느낌이 있어, 일상적인 작업에 딱 맞게 어울립니다. 기본값을 여기에 설정한 Anthropic의 판단은, 실용성을 중시한 좋은 튜닝이라고 느꼈습니다. 솔직히 말하면 max는 아직 사용해 본 적이 없어서, 그것이 필요한 장면이 어디인지는 앞으로 시험해 보면서 찾아가려고 합니다.
그리고 무엇보다, 명령을 더 문자 그대로 실행해 주는 점이 개인적으로는 반갑습니다. 지금까지는 「지시가 애매하면 멋대로 확대 해석되는」 경우가 있었기 때문에, 프롬프트를 정확하게 쓰면 쓸수록 결과에 반영된다는 것은, 엔지니어에게는 오히려 다루기 쉬운 특성입니다.
정리
Claude Opus 4.7의 진화 포인트를 정리하면, 다음과 같습니다.
- 코딩 능력의 한층 더 강화(CursorBench 70%, Rakuten-SWE-Bench 3배)
- 비전 성능의 대폭 향상(XBOW 98.5%, 최대 2,576px)
- 새로운 Effort 레벨
xhigh추가 - 명령을 더 문자 그대로 실행
- Mythos Preview라는 상위 모델의 존재에 대한 언급(한정 제공 중인 research preview)
- 요금 동결
Opus 4.6에서 아직 2개월밖에 지나지 않았는데, 이만큼의 개선이 쌓인 것은 놀랍습니다. Mythos Preview는 현재 한정 제공 중인 research preview라는 위치이며, Anthropic은 향후 Mythos급 모델을 폭넓게 제공해 나가는 것을 목표로 하고 있다고 설명하고 있습니다. 앞으로의 전개가 기대됩니다.
아직 사용해 보지 않으신 분들은, Claude Code나 claude.ai, API에서 시험해 볼 수 있습니다. Claude Code에서는 Max / Team Premium 플랜이라면 업데이트 후 Opus 4.7과 xhigh가 기본값으로 선택될 것입니다. 그 외 플랜에서도 사용 가능한 환경이라면 /model 명령에서 Opus 4.7을 선택할 수 있으니, 꼭 그 차이를 직접 체감해 보세요.