Claude Opus 4.7 を本気でレビュー。コーディング相棒の最終形
1Mコンテキスト、Agent SDK の精度、ツール呼び出しの安定性まで。ライバル各社と並べて検証した。
Anthropic の最新フラッグシップ Claude Opus 4.7 を、2週間にわたって実プロジェクトで使い倒した。 結論としては、ここ数年で最も完成度の高いコーディングLLMだ。
評価サマリー
| 項目 | 評価 |
|---|---|
| コーディング精度 | ★★★★★ |
| ツール呼び出しの安定性 | ★★★★★ |
| コンテキスト保持(1M) | ★★★★☆ |
| 速度 | ★★★★☆ |
| コスト | ★★★☆☆ |
何が新しいのか
過去モデルとの最大の違いは「サブエージェントとの協調」が圧倒的に滑らかになった点。 親エージェントが投げたサブタスクを子が正しく解釈し、 余計な往復なしに成果物を返してくる。Agent SDK ユーザーには福音。
具体的には:
- サブエージェント呼び出し時の context 圧縮が自動で効くようになった
- 親エージェントが渡したタスク記述を、子が"再解釈"せずそのまま実行する確率が体感9割超
- 並列で投げた 5〜6 件のサブエージェントが衝突せず帰ってくる
これまで Agent SDK ユーザーが手作業で書いていた「親プロンプトの整形ロジック」が不要になる。
コーディング精度の検証(実プロジェクト)
筆者が本業で持っている Next.js + Cloudflare Workers のリポジトリで、以下を投げた:
- 巨大 MDX 記事の構造リファクタ(85ファイル横断、frontmatter スキーマ統一)
- i18n の en/ja 二重化(既存ja記事のen訳生成 + ルーティング追加)
- Tailwind v4 への移行(v3 設定ファイル変換、jit クラス書き換え)
体感:
| タスク | Opus 4.7 | Opus 4.6 | GPT-5 |
|---|---|---|---|
| MDX一括リファクタ | 一発成功 | 部分失敗 | 一発成功 |
| en訳の質 | 自然 | 直訳寄り | 自然 |
| Tailwind v4移行 | 80%自走 | 50%自走 | 70%自走 |
特に「指示書を一度読ませたあとの忠実度」が顕著に上がった。CLAUDE.md / AGENTS.md ベースの運用と相性が良い。
1M コンテキストの実用性
カタログ上は 1M トークン保持だが、実用感はどうか:
- コードベース全文を流し込む 用途では実用的(モノレポ規模なら丸ごと入る)
- 長い会話履歴を保持する 用途は API コストとの兼ね合いになる
- 200k あたりまでは精度に体感差なし。500k 超えると指示の忠実度が わずかに低下
- 推奨運用: 200k で
/compactをかけて圧縮、200-500k は丸ごと、500k+ は分割
「1M = 何でも入る = 何でも答えてくれる」ではない。文脈量と精度はゆるやかにトレードオフ。
ライバル比較(2026年6月時点)
| Claude Opus 4.7 | GPT-5 Pro | Gemini 2.5 Pro | |
|---|---|---|---|
| コーディング精度 | ★★★★★ | ★★★★★ | ★★★★☆ |
| ツール呼び出し | ★★★★★ | ★★★★☆ | ★★★★☆ |
| 長文脈 | ★★★★★ | ★★★★☆ | ★★★★★ |
| 指示忠実度 | ★★★★★ | ★★★★☆ | ★★★☆☆ |
| ビジュアル理解 | ★★★★☆ | ★★★★★ | ★★★★☆ |
| 速度 | ★★★★☆ | ★★★★★ | ★★★★★ |
| 価格(出力1M) | $75 | $60 | $25 |
長文脈・ツール呼び出し・指示忠実度の3点セット で Claude が抜けている。 逆にビジュアル理解・速度・コストでは GPT-5 / Gemini に分がある。
どんな使い方が向いているか
- コーディングエージェント運用: 第一選択。Cursor / Claude Code / Cline どれでも◎
- 長大なドキュメント要約: 200k 超えるなら Claude。それ以下なら Gemini が速くて安い
- 画像メイン UI のレビュー: GPT-5 のほうがやや上
- コードレビュー / リファクタ提案: Claude が圧倒的
コスト最適化のコツ
価格は気になるところ。筆者の運用:
- 重い思考は Opus 4.7、ルーチンは Haiku 4.5(Claude Code の "/fast" モード活用)
- システムプロンプトはキャッシュで使い回し(最大90%カット)
- 大量バッチ処理は Batch API で50%オフ
これで体感のコストは GPT-5 を月額ベースで下回るレベルまで圧縮できる。
結論
スコア 95/100。日常のコーディングパートナーとして第一選択にして良い。 価格が気になる人は Haiku 4.5 とのハイブリッド運用がおすすめ。
「コーディングLLMはこれで完成形に近い」というのが2週間使った率直な感想。 次の進化は推論時間の短縮と、画像理解の追い上げ。GPT-5 との真の差別化はそこから先。
関連: 開発環境の置き場
Claude Code をローカルだけでなく、リモートサーバーから常時叩きたい人向け。SSH 1本で繋がる軽量VPSが定番。
コメント (0)
まだコメントはありません。最初の一言を残しませんか?