「結局、どのAIモデルがいくらなのか」を1枚で。本記事は、OpenAI(GPT-5系)・Anthropic(Claude)・Google(Gemini)・xAI(Grok)の主要モデルのAPI料金を、各社公式情報に基づいて横断比較する定番リファレンスです。料金は100万トークンあたりのドル建て(2026年6月時点・各社公式から取得)。モデル更新が速い領域のため、定期的に最新化していきます。
主要AIモデル API料金 横断比較表(2026年6月)
入力・出力はいずれも100万トークンあたりの標準API料金(USD)です。Batch API利用時は各社とも50%引き(後述)。
| モデル | 提供元 | 入力 $/100万tok | 出力 $/100万tok | コンテキスト |
|---|---|---|---|---|
| GPT-5.5 Pro | OpenAI | $30 | $180 | — |
| GPT-5.5 | OpenAI | $5 | $30 | — |
| GPT-5.4 | OpenAI | $2.50 | $15 | — |
| GPT-5.4 mini | OpenAI | $0.75 | $4.50 | — |
| GPT-5.4 nano | OpenAI | $0.20 | $1.25 | — |
| Claude Opus 4.8 | Anthropic | $5 | $25 | 100万 |
| Claude Sonnet 4.6 | Anthropic | $3 | $15 | 100万 |
| Claude Haiku 4.5 | Anthropic | $1 | $5 | — |
| Gemini 3.1 Pro(≤20万tok) | $2 | $12 | 大 | |
| Gemini 3.5 Flash | $1.50 | $9 | 大 | |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | 大 | |
| Grok 4.3 | xAI | $1.25 | $2.50 | 100万 |
| Grok build 0.1 | xAI | $1 | $2 | 26万 |
※ Gemini 3.1 Proは20万トークン超で入力$4・出力$18に上がる従量制。各モデルの最新の正確な料金は、末尾の各社公式ページで確認してください。
ティアで見ると選びやすい|4階層の構図
各社のラインナップは「最上位・標準・軽量・超軽量」の4階層でほぼ対応しており、横で比べると相場感がつかめます。
| ティア | 代表モデル(入力/出力) | 向く用途 |
|---|---|---|
| 最上位(最高精度) | GPT-5.5 Pro($30/$180)・Claude Opus 4.8($5/$25) | 最難関の推論・重要な意思決定支援 |
| 標準(実務の主力) | GPT-5.4($2.50/$15)・Claude Sonnet 4.6($3/$15)・Gemini 3.1 Pro($2/$12) | 本番運用の大半・コードや文章生成 |
| 軽量(高速・安価) | Claude Haiku 4.5($1/$5)・Gemini 3.5 Flash($1.50/$9)・Grok 4.3($1.25/$2.50) | 分類・要約・大量処理 |
| 超軽量(最安) | GPT-5.4 nano($0.20/$1.25)・Gemini 3.1 Flash-Lite($0.25/$1.50) | 単純タスク・前処理・超大量バッチ |
注目はGrok 4.3で、出力が$2.50/100万トークンと標準ティアの性能帯にしては破格。出力が多い用途ではコスト効率が際立ちます。
料金を半減・圧縮する3つの仕組み
表の標準料金は「定価」です。実運用では次の3つで実効コストを大きく下げられます。
| 仕組み | 効果 | 対応 |
|---|---|---|
| Batch API(非同期一括) | 入力・出力とも50%引き | OpenAI・Anthropic・Google いずれも対応 |
| プロンプトキャッシュ | 繰り返す共通プロンプトの入力が大幅割引(Claudeはキャッシュ読み込みが入力の0.1倍) | 主要各社が提供 |
| モデルルーティング | 難しいタスクだけ上位、簡単なものは軽量に振り分けて総額圧縮 | 設計で実現 |
急がない大量処理(分類・要約・評価)はBatchに寄せるだけで半額です。詳しくはChatGPT料金の完全比較や、Claude側のClaude料金 全モデル日本円換算もあわせて参照してください。
用途別の選び方|「最高精度」より「適材適所」
- 本番運用の主力:標準ティア(GPT-5.4 / Sonnet 4.6 / Gemini 3.1 Pro)。精度とコストのバランスが良い。
- 大量の分類・要約:軽量ティア(Haiku 4.5 / Gemini Flash / Grok 4.3)+Batchで最安に。
- 最難関の推論:最上位(GPT-5.5 Pro / Opus 4.8)。ただし出力が高額なので、ここぞの場面に絞る。
- 長文を丸ごと扱う:100万トークン対応のClaude各モデル・Grok 4.3が有利。
多くの現場では「全部を最上位で回す」のが最大の無駄です。標準+軽量を中心に、難所だけ上位に振るのがコスト最適化の定石です。
料金以外で外せない選定軸
| 軸 | 見るポイント |
|---|---|
| コンテキスト長 | 長い文書・コードベースを丸ごと渡すなら100万トークン対応か |
| 出力単価 | 生成量が多い用途は「出力$」が効く。Grok 4.3が割安 |
| キャッシュ・Batch対応 | 実効コストは定価でなく割引込みで比較する |
| 提供形態 | API直・クラウド(Bedrock/Vertex)経由で料金や規約が異なる |
まとめ|料金は「定価×割引×適材適所」で考える
2026年6月時点で、主要4社の標準API料金は「最上位$5〜$30/標準$2〜$3/軽量$0.25〜$1.5」前後の入力単価に収れんしています。差がつくのは出力単価とコンテキスト長、そしてBatch・キャッシュをどう使うかです。
選定の結論はシンプルで、標準ティアを主力に、大量処理は軽量+Batchで半額、難所だけ最上位。この組み合わせが、品質を保ちながらAIコストを最小化する型です。料金は変動が速いため、導入時は必ず各社公式の最新値で再確認してください(本記事も定期更新します)。
参考・出典(各社公式)
- Claude API Pricing — Anthropic(公式)
- API Pricing — OpenAI(公式)
- Gemini API Pricing — Google(公式)
- Models & Pricing — xAI Grok(公式)
100社以上の支援実績|30分の無料相談で導入設計を一緒に組みます
Claude Code / Codex の社内展開・チーム導入・セキュリティ設計まで、貴社の業務と組織に合わせて伴走支援します。
- 100社以上の企業支援実績
- 初回30分無料・即日返信
- 導入後3ヶ月の伴走付き
お問い合わせフォームから24時間以内にUravation担当者がご返信します。



