Claude Opus 4.7 がリリース!Effort xhigh の登場と垣間見えた Mythos のすごさ
目次
こんにちは。2026年4月16日、Anthropic から Claude の新しいモデル「Claude Opus 4.7」が一般公開されました。
Opus 4.6 が登場してまだ2ヶ月ちょっとですが、もう次が出たんですね。Anthropic の進化スピードには相変わらず驚かされます。
僕の環境でも Claude Code の新しいセッションを開始したところ、Opus 4.7 と Effort xhigh がデフォルトに切り替わっていました。なお、Claude Code のデフォルトモデルはプランごとに異なります。Max / Team Premium では Opus 4.7、Pro / Team Standard / Enterprise および Anthropic API 直利用では Sonnet 4.6、Bedrock / Vertex / Foundry 経由では Sonnet 4.5 がデフォルトです(詳細は Claude Code Model configuration を参照してください)。
この記事では 公式アナウンス をベースに、Opus 4.7 の特徴と Opus 4.6 からの変化点を整理していきます。
Opus 4.7の主な進化ポイント
1. コーディング能力のさらなる強化
Anthropic 自身も認めるとおり、Opus 4.7 は「最も難しいコーディングタスクを、以前のような密接な監視なしに任せられる」ほどの信頼性に達したとのことです。
具体的なベンチマーク結果を並べてみると、その進化が分かります。
- CursorBench - Opus 4.6 の 58% に対して Opus 4.7 は 70%
- Rakuten-SWE-Bench - Opus 4.6 比で 3倍以上の本番タスクを解決
- CodeRabbit - リコール(検出漏れの少なさ)が 10% 以上改善
- Databricks の OfficeQA Pro(文書推論・ソース情報タスク) - エラーを 21% 削減
- Terminal-Bench 2.0 - 過去の Claude が解けなかった3つの TBench タスクをクリア
特に Rakuten-SWE-Bench の「3倍」というのはかなりインパクトがありますね。実運用に近いベンチマークでこれだけ差が出るということは、日々の開発体験もそれだけ変わってくるはずです。
2. ビジョン性能の大幅向上
画像まわりの進化も見逃せません。
Opus 4.7 は長辺 **2,576ピクセル(約370万画素)**までの画像を処理できるようになりました。これは従来のモデルの3倍以上の解像度です。スクリーンショットやダイアグラムを渡して読み取ってもらうようなユースケースでは、この解像度の差がかなり効いてきそうです。
そして XBOW のビジュアル精度ベンチマークの結果がすごいです。
- Opus 4.6 - 54.5%
- Opus 4.7 - 98.5%
ほぼ倍近く精度が上がっています。UI のスクリーンショットから要素を抽出したり、手書きの図から情報を読み取ったりといったタスクで、実用レベルに到達したと言ってよさそうです。
3. 新しい Effort レベル「xhigh」の登場
Opus 4.6 で導入された effort コントロールに、新しいレベルが追加されました。
- low
- medium
- high
- xhigh(新規追加)
- max
high と max の間に位置する xhigh(extra high)です。「max ほどのレイテンシはかけたくないけど、high より深く考えてほしい」という微妙な調整ができるようになりました。
Claude Code では、Opus 4.7 が選ばれているときのデフォルト effort が xhigh になっています。僕の手元で /model コマンドを開いたら、すでにそのように設定されていました。
手動で変えたい場合は、これまでどおり /model で Opus を選んだ状態から effort の項目を左右キーで調整できます。タスクがシンプルで速さを重視したい場面では medium や high に下げる、逆にじっくり考えてほしいときは max に上げる、という使い分けが自然にできるようになっています。
4. 命令遵守の強化
公式アナウンスで印象的だったのが、この一節です。
Opus 4.7 is substantially better at following instructions. Interestingly, this means that prompts written for earlier models can sometimes now produce unexpected results: where previous models interpreted instructions loosely or skipped parts entirely, Opus 4.7 takes the instructions literally.
意訳すると、「Opus 4.7 は指示の遵守が大きく改善している。その結果、以前のモデル向けに書かれたプロンプトが予期しない挙動を生むことがある。従来は緩く解釈されたり一部がスキップされたりしていた指示を、Opus 4.7 は文字通りに受け取る」といった内容です。
これは良いニュースでもあり、同時に注意点でもあります。既存のプロンプトをそのまま使うと、従来の「空気を読んだ挙動」ではなく「書かれたとおりの挙動」になるケースがあるので、プロンプトの再調整が必要になることもある、とのことです。
日頃から Claude Code を使っている方は、プロンプトやカスタムコマンドが意図通りに動くか、一度確認してみるのがおすすめですよ。
ちなみに、Claude Code には claude-api という公式スキルが用意されています。これは anthropic や @anthropic-ai/sdk を使った自作アプリを開発・運用している方向けのもので、Claude API の使い方やモデル間の移行手順などの知識がまとまっています。今回このスキルが Opus 4.7 対応にアップデートされていて、Claude Code で「migrate to Opus 4.7」と伝えるだけでモデル名・プロンプト・effort 設定をまとめて書き換えてくれるそうです(@ClaudeDevs の告知)。自分のアプリに Claude API を組み込んでいる方は、ここから手軽に移行できそうですね。
Mythos Previewという存在
今回の発表でもうひとつ興味深かったのが、Claude Mythos Preview への言及です。
公式アナウンスでは Opus 4.7 について、「最強モデルである Claude Mythos Preview ほどの広範な能力は持たないものの、Opus 4.6 を上回る結果を示している」という趣旨で紹介されています。
つまり、Anthropic には Opus 4.7 よりもさらに強力な Mythos Preview というモデルが存在していて、それと比較する形で Opus 4.7 が位置づけられているわけです。
公表されたベンチマークの図を見ても、一番右に位置する Mythos のスコアが群を抜いて高く、「まだ上があるのか……」という驚きがあります。Opus 4.7 でも十分すぎるほどの性能なのに、さらに先を行くモデルが控えているという事実は、今後の Claude の進化を考えるうえでワクワクする話です。
安全性についての位置づけも整理しておきましょう。その前に、ここで頻出する「アライメント」という言葉について少し補足しておきます。
AI におけるアライメント(alignment)とは、AI モデルの振る舞いを、人間の意図・価値観・目的と一致させることを指す概念です。能力の高さ(capability)とは別の軸で、「その能力を安全かつ誠実に使えるか」を評価するものだと捉えると分かりやすいと思います。Anthropic はこの観点を重視していて、具体的には以下のような挙動が少ないモデルを「アライメントが取れている」と表現しています。
- ユーザーをごまかしたり騙したりしない
- ユーザーが喜びそうな答えを優先して事実を曲げない
- 悪用につながる依頼に安易に乗らない
その前提で公式の評価を見ると、Anthropic は Opus 4.7 を「largely well-aligned and trustworthy, though not fully ideal(概ねアライメントが取れており信頼できるが、完全に理想的とは言えない)」と位置づけており、Opus 4.6 と同程度の安全性を保ちつつ一部評価で改善したモデルとして説明しています。一方で、同社の評価で 最もアライメントが取れている(best-aligned)モデルは Mythos Preview とされている点は押さえておきたいところです。
料金
料金は Opus 4.6 から据え置きです。
- 入力トークン - $5 per 1M tokens
- 出力トークン - $25 per 1M tokens
これだけの性能向上がありながら価格が変わらないのは、ユーザーとしては素直にありがたいですね。
さらに、Opus 4.7 は従来より多くの thinking トークンを使うため、その分を補う形でサブスクライバー全員のレートリミットが引き上げられたそうです(@bcherny のツイート)。実行頻度を気にせず使い込める環境が整っているのは嬉しいポイントです。
API では claude-opus-4-7 というモデル ID で利用できます。
Opus 4.6 vs Opus 4.7 比較表
主要な変更点を表にまとめてみました。
| 項目 | Opus 4.6 | Opus 4.7 |
|---|---|---|
| Effort レベル | low / medium / high / max(4段階) | low / medium / high / xhigh / max(5段階) |
| Claude Code デフォルト effort | high(Pro / Max は medium) | xhigh |
| 最大画像解像度 | - | 長辺 2,576px(約370万画素) |
| XBOW(ビジュアル精度) | 54.5% | 98.5% |
| CursorBench | 58% | 70% |
| Rakuten-SWE-Bench | - | Opus 4.6 比 3倍以上 |
| 料金(入力/出力) | $5/$25 per 1M tokens | $5/$25 per 1M tokens(据え置き) |
| 命令の解釈 | やや緩く解釈 | より文字通りに実行 |
Claude Code で試してみる
Opus 4.7 が利用可能な環境では、最新版の Claude Code(公式 Docs によると v2.1.111 以降)で /model コマンドから確認できます。Opus 4.7 を選択したときの Claude Code のデフォルト effort は xhigh です。なお、表示可否やデフォルトの挙動はプラン・provider・管理者設定にも依存します。
もし手元でまだ見えない場合は、Claude Code をアップデートしてから再起動してみると良いと思います。
claude update
アップデート後、新しいセッションを開けば、利用可能な環境では Opus 4.7 を選べるようになります。
ちなみにリリース直後には、Opus 4.7 が普通のコード編集を「this might be malware」と警告して拒否してしまうケースが報告されていたのですが、これはモデルが慎重すぎるのではなく、古いビルドに残っていた古い safety prompt が原因だったとのこと(@ClaudeDevs の告知)。claude update を実行してアプリを再起動すれば解消されるので、もし同じ症状に遭遇した方はアップデートしてみてください。
もしまだ Homebrew や npm 経由で Claude Code を使っている方は、このタイミングでネイティブインストールに切り替えておくことを強くおすすめします。自動更新が効くようになってアップデートの挙動が安定しますし、新機能への追従もスムーズになります。詳しい手順や切り替えのメリットは、Claude Code を Homebrew からネイティブインストールに切り替えたら快適になった話 にまとめているので、ぜひ参考にしてみてください。
使ってみた感想
まだ使い始めたばかりですが、xhigh のデフォルト化はなかなか絶妙なラインだな、というのが第一印象です。
xhigh は「必要十分なところまで考えてくれる」感覚があって、日々の作業にちょうどよく馴染んでいます。デフォルトをここに設定した Anthropic の判断は、実用性を重視した良いチューニングだと感じました。正直なところ max はまだ使ったことがないので、そこまで必要なシーンがどこかは今後試しながら探っていこうと思います。
あとは何より、命令をより文字通りに実行してくれる点が個人的には嬉しいです。これまでは「指示が甘いと勝手に拡大解釈される」ことがあったので、プロンプトを正確に書けば書くほど結果に反映されるというのは、エンジニアにとってはむしろ扱いやすい性質です。
まとめ
Claude Opus 4.7 の進化ポイントをまとめると、こんな感じになります。
- コーディング能力のさらなる強化(CursorBench 70%、Rakuten-SWE-Bench 3倍)
- ビジョン性能の大幅向上(XBOW 98.5%、最大 2,576px)
- 新しい Effort レベル
xhighの追加 - 命令をより文字通りに実行
- Mythos Preview という上位モデルの存在に言及(限定提供中の research preview)
- 料金は据え置き
Opus 4.6 からまだ2ヶ月しか経っていないのに、これだけの改善が積み重なっているのは驚きです。Mythos Preview は現在、限定提供中の research preview という位置づけで、Anthropic は将来的に Mythos-class のモデルを広く提供していくことを目指していると説明しています。今後の展開が楽しみですね。
まだ触っていない方は、Claude Code や claude.ai、API から試せます。Claude Code では、Max / Team Premium プランであればアップデート後に Opus 4.7 と xhigh がデフォルトで選ばれるはずです。それ以外のプランでも、利用可能な環境であれば /model コマンドから Opus 4.7 を選択できますので、ぜひその違いを体感してみてください。