Claude Opus 4.7 출시! Effort xhigh의 등장과 엿보인 Mythos의 대단함

2026-04-18
17분 만에 읽기
업데이트: 2026-04-18
claude-opus-47.webp

목차

안녕하세요. 2026년 4월 16일, Anthropic에서 Claude의 새로운 모델 'Claude Opus 4.7'이 일반에 공개되었습니다.

Opus 4.6이 등장한 지 아직 두 달 남짓밖에 되지 않았는데, 벌써 다음 모델이 나왔네요. Anthropic의 발전 속도에는 변함없이 놀라게 됩니다.

제 환경에서도 Claude Code의 새로운 세션을 시작해 보니, Opus 4.7Effort xhigh가 기본값으로 전환되어 있었습니다. 참고로 Claude Code의 기본 모델은 플랜마다 다릅니다. Max / Team Premium에서는 Opus 4.7, Pro / Team Standard / Enterprise 및 Anthropic API 직접 이용 시에는 Sonnet 4.6, Bedrock / Vertex / Foundry 경유 시에는 Sonnet 4.5가 기본값입니다(자세한 내용은 Claude Code Model configuration을 참조해 주세요).

이 글에서는 공식 발표를 바탕으로, Opus 4.7의 특징과 Opus 4.6에서의 변경 사항을 정리해 보겠습니다.

Opus 4.7의 주요 발전 포인트

1. 코딩 능력의 추가 강화

Anthropic 스스로도 인정하듯, Opus 4.7은 '가장 어려운 코딩 작업을 이전과 같은 밀접한 모니터링 없이 맡길 수 있을' 정도의 신뢰성에 도달했다고 합니다.

구체적인 벤치마크 결과를 나열해 보면 그 발전을 알 수 있습니다.

  • CursorBench - Opus 4.6의 58% 대비 Opus 4.7은 70%
  • Rakuten-SWE-Bench - Opus 4.6 대비 3배 이상의 실무 작업을 해결
  • CodeRabbit - 리콜(누락 없는 탐지율)이 10% 이상 개선
  • Databricks의 OfficeQA Pro(문서 추론 및 소스 정보 작업) - 오류를 21% 감소
  • Terminal-Bench 2.0 - 과거의 Claude가 풀지 못했던 3개의 TBench 작업을 클리어

특히 Rakuten-SWE-Bench의 '3배'라는 수치는 꽤 임팩트가 있네요. 실제 운영에 가까운 벤치마크에서 이 정도 차이가 난다는 것은, 일상적인 개발 경험도 그만큼 달라질 것이라는 뜻입니다.

2. 비전 성능의 대폭 향상

이미지 관련 발전도 놓칠 수 없습니다.

Opus 4.7은 긴 변이 **2,576픽셀(약 370만 화소)**인 이미지까지 처리할 수 있게 되었습니다. 이는 기존 모델의 3배 이상의 해상도입니다. 스크린샷이나 다이어그램을 전달하여 읽어내게 하는 유스케이스에서는 이 해상도의 차이가 꽤 큰 효과를 발휘할 것 같습니다.

그리고 XBOW의 시각적 정확도 벤치마크 결과가 대단합니다.

  • Opus 4.6 - 54.5%
  • Opus 4.7 - 98.5%

거의 두 배 가까이 정확도가 높아졌습니다. UI 스크린샷에서 요소를 추출하거나, 손으로 그린 그림에서 정보를 읽어내는 등의 작업에서 실용적인 수준에 도달했다고 해도 과언이 아닐 것 같습니다.

3. 새로운 Effort 레벨 'xhigh'의 등장

Opus 4.6에서 도입된 effort 컨트롤에 새로운 레벨이 추가되었습니다.

  • low
  • medium
  • high
  • xhigh(신규 추가)
  • max

highmax 사이에 위치하는 xhigh(extra high)입니다. 'max만큼의 지연 시간을 들이고 싶지는 않지만, high보다는 깊게 생각해 주었으면 좋겠다'는 미묘한 조정을 할 수 있게 되었습니다.

Claude Code에서는 Opus 4.7이 선택되어 있을 때의 기본 effort가 xhigh로 되어 있습니다. 제 환경에서 /model 명령어를 열어보니 이미 그렇게 설정되어 있었습니다.

수동으로 변경하고 싶은 경우에는, 이전과 마찬가지로 /model에서 Opus를 선택한 상태에서 effort 항목을 좌우 방향키로 조정할 수 있습니다. 작업이 단순하여 속도를 중시하고 싶은 상황에서는 medium이나 high로 낮추고, 반대로 곰곰이 생각해 주길 바랄 때는 max로 올리는 식의 구분을 자연스럽게 할 수 있게 되었습니다.

4. 명령 준수 능력 강화

공식 발표에서 인상적이었던 것이 이 구절입니다.

Opus 4.7 is substantially better at following instructions. Interestingly, this means that prompts written for earlier models can sometimes now produce unexpected results: where previous models interpreted instructions loosely or skipped parts entirely, Opus 4.7 takes the instructions literally.

의역하자면, "Opus 4.7은 지시 준수 능력이 크게 개선되었다. 그 결과, 이전 모델용으로 작성된 프롬프트가 예기치 않은 동작을 일으킬 수 있다. 기존에는 느슨하게 해석되거나 일부가 생략되었던 지시를 Opus 4.7은 문자 그대로 받아들인다"라는 내용입니다.

이는 좋은 소식이기도 하지만, 동시에 주의할 점이기도 합니다. 기존 프롬프트를 그대로 사용하면, 기존의 '문맥을 파악하는 동작'이 아니라 '적힌 그대로의 동작'이 되는 경우가 있으므로 프롬프트의 재조정이 필요할 수도 있다고 합니다.

평소 Claude Code를 사용하시는 분들은 프롬프트나 커스텀 명령어가 의도대로 작동하는지 한 번 확인해 보시는 것을 추천합니다.

참고로 Claude Code에는 claude-api라는 공식 스킬이 준비되어 있습니다. 이는 anthropic이나 @anthropic-ai/sdk를 사용해 자체 앱을 개발 및 운영하고 있는 분들을 위한 것으로, Claude API 사용법이나 모델 간 마이그레이션 절차 등의 지식이 정리되어 있습니다. 이번에 이 스킬이 Opus 4.7 대응으로 업데이트되어서, Claude Code에 'migrate to Opus 4.7'이라고 입력하기만 하면 모델명, 프롬프트, effort 설정을 한꺼번에 다시 작성해 준다고 합니다(@ClaudeDevs의 공지). 자신의 앱에 Claude API를 연동하고 있는 분들은 이를 통해 간편하게 마이그레이션할 수 있겠네요.

Mythos Preview라는 존재

이번 발표에서 또 하나 흥미로웠던 점은 Claude Mythos Preview에 대한 언급입니다.

공식 발표에서는 Opus 4.7에 대해 '최강 모델인 Claude Mythos Preview만큼의 광범위한 능력은 갖추지 못했지만, Opus 4.6을 뛰어넘는 결과를 보여주고 있다'는 취지로 소개하고 있습니다.

즉, Anthropic에는 Opus 4.7보다 훨씬 더 강력한 Mythos Preview라는 모델이 존재하며, 이와 비교하는 형태로 Opus 4.7이 자리매김하고 있는 것입니다.

공개된 벤치마크 그래프를 보더라도 가장 오른쪽에 위치한 Mythos의 점수가 월등히 높아, '아직 더 위가 있단 말인가……' 하는 놀라움을 줍니다. Opus 4.7만으로도 차고 넘치는 성능인데, 그보다 더 앞서가는 모델이 대기하고 있다는 사실은 앞으로의 Claude의 발전을 생각할 때 무척 설레는 이야기입니다.

안전성에 대한 위치도 정리해 두겠습니다. 그 전에, 여기서 자주 등장하는 '얼라인먼트(alignment)'라는 단어에 대해 조금 보충 설명을 하겠습니다.

AI에서의 얼라인먼트(alignment)란, AI 모델의 동작을 인간의 의도, 가치관, 목적과 일치시키는 것을 가리키는 개념입니다. 능력의 높고 낮음(capability)과는 다른 축으로, '그 능력을 안전하고 성실하게 사용할 수 있는가'를 평가하는 것이라고 이해하시면 쉽습니다. Anthropic은 이 관점을 중시하고 있으며, 구체적으로는 다음과 같은 동작이 적은 모델을 '얼라인먼트가 잘 맞춰져 있다'고 표현합니다.

  • 사용자를 속이거나 기만하지 않음
  • 사용자가 좋아할 만한 대답을 우선시하여 사실을 왜곡하지 않음
  • 악용으로 이어질 수 있는 요청에 쉽게 응하지 않음

이러한 전제하에 공식 평가를 보면, Anthropic은 Opus 4.7을 'largely well-aligned and trustworthy, though not fully ideal(대체로 얼라인먼트가 잘 맞춰져 있고 신뢰할 수 있으나, 완전히 이상적이라고는 할 수 없음)'이라고 규정하고 있으며, Opus 4.6과 비슷한 수준의 안전성을 유지하면서 일부 평가에서 개선된 모델로 설명하고 있습니다. 한편, 동사의 평가에서 가장 얼라인먼트가 잘 맞춰진(best-aligned) 모델은 Mythos Preview로 여겨진다는 점은 짚고 넘어가야 할 부분입니다.

요금

요금은 Opus 4.6과 동일하게 동결되었습니다.

  • 입력 토큰 - $5 per 1M tokens
  • 출력 토큰 - $25 per 1M tokens

이 정도의 성능 향상이 있으면서도 가격이 변하지 않는 것은 사용자 입장에서는 정말 고마운 일입니다.

게다가 Opus 4.7은 기존보다 더 많은 thinking 토큰을 사용하기 때문에, 그만큼을 보완하는 형태로 모든 구독자의 속도 제한이 상향 조정되었다고 합니다(@bcherny의 트윗). 실행 빈도를 신경 쓰지 않고 마음껏 사용할 수 있는 환경이 갖춰진 것은 기쁜 포인트입니다.

API에서는 claude-opus-4-7이라는 모델 ID로 이용할 수 있습니다.

Opus 4.6 vs Opus 4.7 비교표

주요 변경 사항을 표로 정리해 보았습니다.

항목Opus 4.6Opus 4.7
Effort 레벨low / medium / high / max(4단계)low / medium / high / xhigh / max(5단계)
Claude Code 기본 efforthigh(Pro / Max는 medium)xhigh
최대 이미지 해상도-긴 변 2,576px(약 370만 화소)
XBOW(시각적 정확도)54.5%98.5%
CursorBench58%70%
Rakuten-SWE-Bench-Opus 4.6 대비 3배 이상
요금(입력/출력)$5/$25 per 1M tokens$5/$25 per 1M tokens(동결)
명령 해석다소 느슨하게 해석더욱 문자 그대로 실행

Claude Code에서 테스트해 보기

Opus 4.7을 이용할 수 있는 환경에서는 최신 버전의 Claude Code(공식 문서에 따르면 v2.1.111 이후)에서 /model 명령어로 확인할 수 있습니다. Opus 4.7을 선택했을 때 Claude Code의 기본 effort는 xhigh입니다. 참고로 표시 여부나 기본 동작은 플랜, provider, 관리자 설정에 따라서도 달라집니다.

만약 현재 환경에서 아직 보이지 않는다면, Claude Code를 업데이트한 후 재시작해 보시는 것이 좋습니다.

claude update

업데이트 후 새로운 세션을 열면, 이용 가능한 환경에서는 Opus 4.7을 선택할 수 있게 됩니다.

참고로 출시 직후에는 Opus 4.7이 평범한 코드 편집을 'this might be malware'라고 경고하며 거부해 버리는 사례가 보고되었는데, 이는 모델이 너무 신중해서가 아니라 이전 빌드에 남아 있던 오래된 safety prompt가 원인이었다고 합니다(@ClaudeDevs의 공지). claude update를 실행하여 앱을 재시작하면 해결되므로, 만약 같은 증상을 겪으신 분들은 업데이트해 보시기 바랍니다.

만약 아직 Homebrew나 npm을 통해 Claude Code를 사용하고 계신 분들은, 이 타이밍에 네이티브 설치로 전환해 두는 것을 강력히 추천합니다. 자동 업데이트가 적용되어 업데이트 동작이 안정화되고, 새로운 기능도 원활하게 따라갈 수 있습니다. 자세한 절차나 전환의 장점은 Claude Code, Homebrew 대신 네이티브 설치로 바꿨더니 확 달라졌다에 정리해 두었으니 꼭 참고해 보세요.

사용해 본 감상

아직 사용하기 시작한 지 얼마 되지 않았지만, xhigh가 기본값으로 설정된 것은 꽤 절묘한 기준이라는 것이 첫인상입니다.

xhigh는 '필요충분한 수준까지 생각해 준다'는 느낌이 있어서, 일상적인 작업에 딱 알맞게 녹아듭니다. 기본값을 이곳으로 설정한 Anthropic의 판단은 실용성을 중시한 훌륭한 튜닝이라고 느꼈습니다. 솔직히 max는 아직 사용해 본 적이 없어서, 그 정도까지 필요한 상황이 어디일지는 앞으로 테스트해 보면서 찾아보려고 합니다.

그리고 무엇보다, 명령을 더욱 문자 그대로 실행해 준다는 점이 개인적으로는 기쁩니다. 지금까지는 '지시가 명확하지 않으면 멋대로 확대 해석되는' 경우가 있었기 때문에, 프롬프트를 정확하게 작성하면 할수록 결과에 반영된다는 것은 엔지니어 입장에서는 오히려 다루기 쉬운 특성입니다.

요약

Claude Opus 4.7의 발전 포인트를 요약하면 다음과 같습니다.

  • 코딩 능력의 추가 강화(CursorBench 70%, Rakuten-SWE-Bench 3배)
  • 비전 성능의 대폭 향상(XBOW 98.5%, 최대 2,576px)
  • 새로운 Effort 레벨 xhigh 추가
  • 명령을 더욱 문자 그대로 실행
  • Mythos Preview라는 상위 모델의 존재 언급(제한적으로 제공 중인 research preview)
  • 요금은 동결

Opus 4.6이 나온 지 아직 두 달밖에 지나지 않았는데, 이 정도의 개선이 쌓여 있다는 것이 놀랍습니다. Mythos Preview는 현재 제한적으로 제공 중인 research preview라는 위치에 있으며, Anthropic은 장기적으로 Mythos-class의 모델을 널리 제공해 나가는 것을 목표로 하고 있다고 설명합니다. 앞으로의 전개가 기대되네요.

아직 사용해 보지 않으신 분들은 Claude Code나 claude.ai, API를 통해 테스트해 볼 수 있습니다. Claude Code에서는 Max / Team Premium 플랜이라면 업데이트 후 Opus 4.7과 xhigh가 기본으로 선택될 것입니다. 그 외의 플랜이라도 이용 가능한 환경이라면 /model 명령어로 Opus 4.7을 선택할 수 있으니, 꼭 그 차이를 체감해 보시기 바랍니다.

참고 링크

이 기사 공유하기

관련 기사