結論: 2026年のClaude最新ラインアップはOpus 4.7・Sonnet 4.6・Haiku 4.5の3段構成。Opus 4.7がSWE-bench Verified 87.6%でGPT-5.4を上回り、Sonnet 4.6は$3/MTokでほぼ同等の品質を提供します。
この記事の要点:
- Opus 4.7はSWE-bench Pro 64.3%・GPQA 94.2%・MCP-Atlas 77.3%でGPT-5.4に優位
- 料金はOpus 4.7が$5/$25/MTok、Sonnet 4.6が$3/$15/MTok(Opus比40%安)
- 80〜90%のタスクはSonnet 4.6で十分。Opus 4.7は複雑なエージェント・大規模コードベース向け
対象読者: APIやClaudeサブスクリプションの選定を検討中の開発者・IT担当者・経営者
読了後にできること: 自社用途に合ったモデルとプランを今日中に決定できる
「Claudeって種類が多くてどれを使えばいいのか分からない」
企業向けAI研修でこの質問は本当によく出てきます。Opus・Sonnet・Haiku、さらに4.6や4.7と番号まで増えてきて、混乱するのは当然です。
2026年4月にAnthropicがOpus 4.7をリリースしました。その後1ヶ月ほど経ち、実際に業務で使い込んだ感触として「Sonnet 4.6でほぼ十分、Opus 4.7は本当に難しいタスクだけ」という結論になっています。ただ、その「本当に難しいタスク」の性能差は大きい。
この記事では、公式APIドキュメントとベンチマーク結果をもとに、Claudeの現行モデル全体を整理します。料金・性能・用途の3軸でどのモデルを選ぶべきか、コピペ可能なコード例も含めて全解説します。
まず5分で分かる:モデル選択チートシート
迷ったらこの表を見てください。研修先でも「印刷してデスクに貼っています」という声が多いフォーマットです。
| 用途 | 推奨モデル | 理由 |
|---|---|---|
| チャット・Q&A・文書要約 | Sonnet 4.6 | 速くて安い。品質はOpusの98%水準 |
| バグ修正・単体機能実装 | Sonnet 4.6 | コスト効率が圧倒的に良い |
| 大規模リファクタリング(1万行超) | Opus 4.7 | 深い文脈理解が必要 |
| マルチエージェント協調 | Opus 4.7 | SWE-bench Pro 64.3%。エージェント推論が最強 |
| 高解像度画像分析・Computer Use | Opus 4.7 | 最大2,576px対応(旧モデルは1,568px) |
| 大量バッチ処理(非リアルタイム) | Haiku 4.5(Batch API) | $0.5/$2.5/MTokで最安値 |
| コスト最優先・単純分類 | Haiku 4.5 | $1/$5/MTok、速度最速 |
このチートシートは「Opus 4.7でないと困る局面は思ったより少ない」という現場感から作りました。まず全タスクをSonnet 4.6で動かし、精度が足りない場合だけOpusに昇格させるルーティング設計が実際のコスト最適解です。
Claudeのモデル体系:2026年5月時点の全ラインアップ
Anthropicの公式ドキュメントに基づいたモデル一覧です(2026年5月現在)。
現行モデル(推奨)
| モデル | API ID | コンテキスト | Max出力 | 知識カットオフ |
|---|---|---|---|---|
| Claude Opus 4.7 | claude-opus-4-7 | 100万トークン | 12.8万トークン | 2026年1月 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 100万トークン | 6.4万トークン | 2025年8月 |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | 20万トークン | 6.4万トークン | 2025年2月 |
Opus 4.7とSonnet 4.6は1Mトークンの巨大コンテキストウィンドウに対応しています。1Mトークンはおよそ75万英単語、日本語でも長編小説数冊分に相当します。長大なコードベース全体をプロンプトに投入してレビューするような用途でも、追加課金なしに標準料金が適用されます。
重要: Opus 4.7では新しいトークナイザーが採用されており、同じテキストで最大35%多くトークンを使用します。請求額は料金カード上変わっていないように見えても、実質的な単価が上がっている可能性があります。移行後は必ずトークン消費量を再測定してください。
出典: Anthropic公式料金ページ
Claude Projects・Memoryの詳細な活用方法については別記事でまとめています。エンタープライズ導入時に重要なデータ管理の観点も含めて解説していますので合わせてご覧ください。
ベンチマーク比較:Opus 4.7 vs Sonnet 4.6 vs GPT-5.4
抽象的な「最高性能」という説明より、数字で見た方が判断しやすいです。以下はAnthropicの公式発表とサードパーティの測定値をまとめたものです。
主要ベンチマーク比較表
| ベンチマーク | Opus 4.7 | Sonnet 4.6 | GPT-5.4 | 備考 |
|---|---|---|---|---|
| SWE-bench Verified | 87.6% | — | — | ソフトウェアエンジニアリング(実務ベース) |
| SWE-bench Pro | 64.3% | — | 57.7% | 多言語・複雑コード修正タスク |
| GPQA Diamond | 94.2% | — | 94.4%(GPT-5.4 Pro) | 大学院レベル科学推論 |
| MMLU Pro | 89.87% | — | — | 専門知識・多分野QA |
| MCP-Atlas(ツール使用) | 77.3% | — | 68.1% | エージェントのツール活用能力 |
| OSWorld-Verified(コンピューター操作) | 78.0% | — | 75.0% | Computer Use タスク |
出典: The Next Web(2026年4月)、Vellum AI
Opus 4.6からOpus 4.7への進化点
Opus 4.7は単なるマイナーアップデートではありません。Anthropicは「agentic codingにおけるstep-change improvement」と表現しています。
- コーディング性能: SWE-bench Verified 80.8% → 87.6%(+6.8ポイント)
- マルチ言語コード修正: SWE-bench Pro 53.4% → 64.3%(+10.9ポイント)
- ビジョン解像度: 1,568px(約1.15MP)→ 2,576px(約3.75MP)
- 知識カットオフ: 2025年5月 → 2026年1月(8ヶ月分更新)
特に注目はビジョン解像度の向上です。2.5倍以上の高解像度対応になったことで、細かい図面・スクリーンショット・医療画像など、これまでは読み取りが困難だった密度の高い画像が扱えるようになりました。
料金体系:APIとサブスクリプション全パターン
Claudeの料金は大きく「個人・チーム向けサブスクリプション」と「API利用(従量課金)」の2系統です。
サブスクリプションプラン比較
| プラン | 月額(USD) | 主な対象 | 特徴 |
|---|---|---|---|
| Free | $0 | 個人・試用 | Webブラウザ・iOS・Android・デスクトップ。使用制限あり |
| Pro | $20(年払いは$17) | 個人ヘビーユーザー | Freeの5倍利用量。全モデルアクセス |
| Max 5x | $100 | フルタイム利用者・開発者 | Proの5倍(=Freeの25倍)。優先アクセス |
| Max 20x | $200 | ヘビーデベロッパー・研究者 | Proの20倍。レートリミットが実質問題にならない |
| Team | $30/ユーザー(最低5人) | 中小チーム | 管理コンソール・共有Projects |
APIトークン料金(2026年5月現在)
プログラムから使うAPI料金です。単位はMTok(100万トークン)。
| モデル | 入力 | 出力 | Batch入力 | Batch出力 |
|---|---|---|---|---|
| Claude Opus 4.7 | $5.00 | $25.00 | $2.50 | $12.50 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $1.50 | $7.50 |
| Claude Haiku 4.5 | $1.00 | $5.00 | $0.50 | $2.50 |
コスト削減オプション
APIを活用するなら、この2つのオプションで実質コストを大幅に下げられます。
プロンプトキャッシュ: 繰り返し使うシステムプロンプトやドキュメントをキャッシュすると、キャッシュ読み出し時は通常入力料金の10%のみ請求されます。チャットボットや大量のRAGリクエストで効果的。
Batch API: 非リアルタイムで処理できるタスクは50%割引。大量の文書分類・翻訳・サマリー生成に最適。
import anthropic
client = anthropic.Anthropic()
# プロンプトキャッシュを使った実装例(Sonnet 4.6)
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system=[
{
"type": "text",
"text": "あなたは法律文書のレビューアシスタントです。...(長い共通プロンプト)...",
"cache_control": {"type": "ephemeral"} # キャッシュマーク
}
],
messages=[
{"role": "user", "content": "この契約書の第3条をレビューしてください。"}
]
)
print(response.content[0].text)
# キャッシュヒット時: 入力料金は通常の10%($0.30/MTok)
import anthropic
client = anthropic.Anthropic()
# Batch API を使った非同期一括処理
# 100件のサポートチケットを一括分類する例
requests = [
{
"custom_id": f"ticket-{i}",
"params": {
"model": "claude-haiku-4-5-20251001",
"max_tokens": 128,
"messages": [
{
"role": "user",
"content": f"次のサポートチケットをカテゴリ分類してください: {ticket_text}"
}
]
}
}
for i, ticket_text in enumerate(tickets)
]
batch = client.messages.batches.create(requests=requests)
print(f"Batch ID: {batch.id}")
# 処理完了後に結果取得(最大24時間以内)
GPT-5.4との性能・料金比較マトリクス
「ClaudeとGPTどちらが良いか」は、用途によって答えが変わります。架空の比較ではなく、実際のベンチマークと公表されている料金で整理します。
| 観点 | Claude Opus 4.7 | Claude Sonnet 4.6 | GPT-5.4(参考) |
|---|---|---|---|
| コーディング(SWE-bench Pro) | 64.3% | — | 57.7% |
| 科学推論(GPQA) | 94.2% | — | 94.4% |
| エージェント・ツール使用 | 77.3% | — | 68.1% |
| Computer Use | 78.0% | — | 75.0% |
| API入力料金 | $5.00/MTok | $3.00/MTok | — |
| コンテキストウィンドウ | 100万トークン | 100万トークン | — |
コーディングタスクではOpus 4.7がGPT-5.4を明確に上回っています。一方、純粋な科学推論(GPQA)では両者はほぼ同等。マルチエージェントやCopiloterとしてのツール連携を重視するならClaudeが有利です。
GPT-5.4の公式料金は2026年5月時点では公開されていないため比較を省略しています。
業務適性:用途別にどのモデルを選ぶか
「最高スペックのモデルを使えばいい」は正しくありません。コスト・速度・精度のバランスを用途別に最適化するのが正解です。
コード生成・開発補助
日常的なコーディング → Sonnet 4.6
import anthropic
client = anthropic.Anthropic()
# Sonnet 4.6でバグ修正(コスト最適)
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=2048,
messages=[
{
"role": "user",
"content": """以下のPythonコードのバグを修正してください。
def calculate_average(numbers):
return sum(numbers) / len(numbers)
# エラーケース: 空リストを渡した時
result = calculate_average([]) # ZeroDivisionError"""
}
]
)
print(response.content[0].text)
大規模リファクタリング・アーキテクチャ設計 → Opus 4.7
import anthropic
client = anthropic.Anthropic()
# 大規模コードベースのリファクタリング(Opus 4.7)
# 1Mトークンのコンテキストを活用し、大型リポジトリ全体を渡すことも可能
with open("large_codebase.py", "r") as f:
code_content = f.read()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=8192,
messages=[
{
"role": "user",
"content": f"""このコードベース全体をレビューして、以下の観点で改善提案をしてください:
1. SOLID原則への準拠
2. パフォーマンスボトルネック
3. セキュリティリスク
コード:
{code_content}"""
}
]
)
print(response.content[0].text)
文書要約・コンテンツ生成
日常的な文書作業 → Sonnet 4.6
# curl で素早くテスト
curl https://api.anthropic.com/v1/messages
--header "x-api-key: $ANTHROPIC_API_KEY"
--header "anthropic-version: 2023-06-01"
--header "content-type: application/json"
--data '{
"model": "claude-sonnet-4-6",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": "以下の会議録を3点の箇条書きで要約してください:(会議録テキスト)"
}
]
}'
Claude Code / Agents SDKでの活用
Anthropicが提供するClaude Agent SDKを使うと、複数のツールを自律的に使うエージェントを構築できます。この用途ではOpus 4.7のMCP-Atlas 77.3%(GPT-5.4比+9.2ポイント)が実力を発揮します。
import asyncio
from claude_agent_sdk import query, ClaudeCodeOptions
async def run_agent():
"""Claude Agent SDKで自律コーディングエージェントを実行"""
async for message in query(
prompt="src/auth.pyのJWTトークン検証ロジックを見直して、セキュリティ上の問題を修正してください",
options=ClaudeCodeOptions(
model="claude-opus-4-7", # エージェントはOpus 4.7推奨
max_turns=10,
)
):
if message.type == "assistant":
print(message.content)
elif message.type == "result":
print(f"完了: {message.result}")
asyncio.run(run_agent())
import anthropic
client = anthropic.Anthropic()
# ツール定義を使ったエージェント実装(Agents SDK不使用版)
tools = [
{
"name": "read_file",
"description": "ファイルの内容を読み取ります",
"input_schema": {
"type": "object",
"properties": {
"path": {"type": "string", "description": "ファイルパス"}
},
"required": ["path"]
}
},
{
"name": "write_file",
"description": "ファイルに内容を書き込みます",
"input_schema": {
"type": "object",
"properties": {
"path": {"type": "string", "description": "ファイルパス"},
"content": {"type": "string", "description": "書き込む内容"}
},
"required": ["path", "content"]
}
}
]
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=4096,
tools=tools,
messages=[
{
"role": "user",
"content": "config.jsonを読み取り、production環境用の設定に更新してconfig_prod.jsonとして保存してください"
}
]
)
# ツール使用の処理
for block in response.content:
if block.type == "tool_use":
print(f"使用ツール: {block.name}")
print(f"入力: {block.input}")
Agents SDKについてはCodex Cloudとの並列エージェント設計の記事でも詳しく解説しています。
エンタープライズ導入:プラン選定・SSO・データ取り扱い
プラン選定フレームワーク
10名以下のチームなら、まずTeamプラン($30/ユーザー)から始めることを勧めています。API利用量が月$500を超えたタイミングで、エンタープライズプランへの移行を検討するのが現実的です。
| 規模 | 推奨プラン | 月額目安 |
|---|---|---|
| 個人・フリーランス | Pro or Max 5x | $20〜$100 |
| 5〜50人のチーム | Team | $30/人 |
| 50人以上・API大量利用 | Enterprise(要問い合わせ) | カスタム |
データ取り扱いの注意点
エンタープライズ導入で必ず確認すべき点を整理します。
- 学習データとしての利用: Anthropicはデフォルトでは会話データをモデル学習に使用しないと公表しています。ただしAPIとclaudeaiのWebインターフェースでは扱いが異なる場合があるため、プライバシーポリシーの最新版を確認してください
- US-Only推論: データを米国内のサーバーのみで処理したい場合は
inference_geo: "us"パラメータを使用(入力/出力料金に1.1倍の地域課金が加算) - AWS Bedrock経由: AWSのVPC環境から使う場合はAmazon Bedrock経由のエンドポイントを使用。SOC2/ISO27001準拠が必要な場合は特にこちらを推奨
import anthropic
client = anthropic.Anthropic()
# US-Only推論の指定
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
extra_headers={
"anthropic-beta": "inference-geo-2025-09-01"
},
extra_body={
"inference_geo": "us" # 米国内サーバーのみで処理
},
messages=[
{"role": "user", "content": "機密性の高い契約書を分析してください。"}
]
)
【要注意】よくある失敗パターンと回避策
失敗1:「最高スペック=最良選択」でOpus 4.7を全タスクに使う
❌ 全APIリクエストにOpus 4.7を使う
⭕ タスク難易度でモデルをルーティングする
顧問先のスタートアップで見た実例ですが、チャットボット用途で全リクエストをOpus 4.7に向けていたところ、月のAPI請求が予算の3倍になっていました。Sonnet 4.6に切り替えたところ同等の品質で60%以上のコスト削減になりました。
def select_model(task_complexity: str) -> str:
"""タスク複雑度に応じてモデルを選択"""
routing = {
"simple": "claude-haiku-4-5-20251001", # 分類・単純Q&A
"standard": "claude-sonnet-4-6", # 文書生成・コーディング
"complex": "claude-opus-4-7", # 大規模コード・マルチエージェント
}
return routing.get(task_complexity, "claude-sonnet-4-6")
# 実際の使用例
model = select_model("standard")
print(f"使用モデル: {model}") # claude-sonnet-4-6
失敗2:Opus 4.7移行後にトークンコストを再測定しない
❌ 「料金カードが変わっていないから大丈夫」と油断する
⭕ 新トークナイザーによる実消費量を計測してから移行する
Opus 4.7は新しいトークナイザーを採用しており、同じテキストで最大35%多くのトークンを消費します。料金は据え置き($5/$25/MTok)ですが、リクエストあたりの実コストが増える可能性があります。移行前に必ずサンプルリクエストでトークン消費量を計測してください。
import anthropic
client = anthropic.Anthropic()
# トークン消費量の計測
test_text = "(代表的なプロダクション用テキスト)"
for model in ["claude-opus-4-6", "claude-opus-4-7"]:
response = client.messages.create(
model=model,
max_tokens=10,
messages=[{"role": "user", "content": test_text}]
)
usage = response.usage
print(f"{model}: input={usage.input_tokens} tokens")
失敗3:プロンプトキャッシュを設定せずコストを垂れ流す
❌ 毎回同じシステムプロンプトを送信し続ける
⭕ 共通部分をcache_controlでキャッシュする
長いシステムプロンプトをキャッシュするだけで入力コストを最大90%削減できます。設定はcache_control: {"type": "ephemeral"}の1行を追加するだけです。
失敗4:Claude Codeでモデルを固定指定し、コスト意識がなくなる
❌ Claude Code(Max 5x/$100)を使い始めた後、APIコストをモニタリングしない
⭕ サブスクリプションとAPI利用の使い分けを意識する
Max 5xプランはClaudeとの対話(claude.ai)には向いていますが、本番アプリケーションへの組み込みはAPIのほうがコスト管理しやすいです。両方のコストを月次で把握する仕組みを作ることを推奨します。
実装サンプル:Pythonで始めるClaude API
# インストール
pip install anthropic
# 環境変数設定
export ANTHROPIC_API_KEY="your-api-key-here"
import anthropic
import os
# 基本的なメッセージ送信
client = anthropic.Anthropic(api_key=os.environ.get("ANTHROPIC_API_KEY"))
message = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[
{
"role": "user",
"content": "日本のAI規制の現状を300字以内で教えてください。"
}
]
)
print(message.content[0].text)
print(f"n使用トークン: 入力={message.usage.input_tokens}, 出力={message.usage.output_tokens}")
import anthropic
client = anthropic.Anthropic()
# ストリーミングレスポンス(ユーザー体験の改善)
with client.messages.stream(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[
{
"role": "user",
"content": "AIエージェントの業務活用について詳しく教えてください。"
}
]
) as stream:
for text in stream.text_stream:
print(text, end="", flush=True)
final_message = stream.get_final_message()
print(f"nn合計出力トークン: {final_message.usage.output_tokens}")
import anthropic
import base64
client = anthropic.Anthropic()
# Opus 4.7のビジョン機能(高解像度画像分析)
# 2,576px対応で詳細な図面・スクリーンショット解析が可能
with open("architecture_diagram.png", "rb") as f:
image_data = base64.standard_b64encode(f.read()).decode("utf-8")
response = client.messages.create(
model="claude-opus-4-7", # 高解像度ビジョンはOpus 4.7
max_tokens=2048,
messages=[
{
"role": "user",
"content": [
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/png",
"data": image_data,
},
},
{
"type": "text",
"text": "このシステムアーキテクチャ図を解析して、セキュリティリスクを指摘してください。"
}
],
}
],
)
print(response.content[0].text)
参考・出典
- Models overview — Anthropic公式APIドキュメント(参照日: 2026-05-06)
- Pricing — Anthropic公式APIドキュメント(参照日: 2026-05-06)
- Plans & Pricing — claude.com(参照日: 2026-05-06)
- Claude Opus 4.7 leads on SWE-bench and agentic reasoning — The Next Web(参照日: 2026-05-06)
- Claude Opus 4.7 Benchmarks Explained — Vellum AI(参照日: 2026-05-06)
まとめ:今日から始める3つのアクション
- 今日やること: Anthropic ConsoleでAPIキーを取得し、
claude-sonnet-4-6でサンプルリクエストを1本送る(5分で完了) - 今週中: 自社の主なユースケースをリストアップし、本記事のチートシートと照らし合わせてモデルルーティング設計を作成する
- 今月中: プロンプトキャッシュとBatch APIを導入し、先月のAPIコストと比較してコスト削減率を測定する
著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー約10万人)。100社以上の企業向けAI研修・導入支援を展開。著書『AIエージェント仕事術』(SBクリエイティブ)。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。
ご質問・ご相談は お問い合わせフォーム からお気軽にどうぞ。




