主要AIモデル API料金横断比較表（2026年6月）とは？

本記事の「主要AIモデル API料金横断比較表（2026年6月）」セクションで完全解説しています。

ティアで見ると選びやすい｜4階層の構図とは？

本記事の「ティアで見ると選びやすい｜4階層の構図」セクションで完全解説しています。

料金を半減・圧縮する3つの仕組みとは？

本記事の「料金を半減・圧縮する3つの仕組み」セクションで完全解説しています。

用途別の選び方｜「最高精度」より「適材適所」とは？

本記事の「用途別の選び方｜「最高精度」より「適材適所」」セクションで完全解説しています。

料金以外で外せない選定軸とは？

本記事の「料金以外で外せない選定軸」セクションで完全解説しています。

まとめ｜料金は「定価×割引×適材適所」で考えるとは？

本記事の「まとめ｜料金は「定価×割引×適材適所」で考える」セクションで完全解説しています。

参考・出典（各社公式）とは？

本記事の「参考・出典（各社公式）」セクションで完全解説しています。

2026.06.16

主要AIモデルAPI料金横断比較【2026年6月・毎月更新】

「結局、どのAIモデルがいくらなのか」を1枚で。本記事は、OpenAI（GPT-5系）・Anthropic（Claude）・Google（Gemini）・xAI（Grok）の主要モデルのAPI料金を、各社公式情報に基づいて横断比較する定番リファレンスです。料金は100万トークンあたりのドル建て（2026年6月時点・各社公式から取得）。モデル更新が速い領域のため、定期的に最新化していきます。

主要AIモデル API料金横断比較表（2026年6月）

入力・出力はいずれも100万トークンあたりの標準API料金（USD）です。Batch API利用時は各社とも50%引き（後述）。

モデル	提供元	入力 $/100万tok	出力 $/100万tok	コンテキスト
GPT-5.5 Pro	OpenAI	$30	$180	—
GPT-5.5	OpenAI	$5	$30	—
GPT-5.4	OpenAI	$2.50	$15	—
GPT-5.4 mini	OpenAI	$0.75	$4.50	—
GPT-5.4 nano	OpenAI	$0.20	$1.25	—
Claude Opus 4.8	Anthropic	$5	$25	100万
Claude Sonnet 4.6	Anthropic	$3	$15	100万
Claude Haiku 4.5	Anthropic	$1	$5	—
Gemini 3.1 Pro（≤20万tok）	Google	$2	$12	大
Gemini 3.5 Flash	Google	$1.50	$9	大
Gemini 3.1 Flash-Lite	Google	$0.25	$1.50	大
Grok 4.3	xAI	$1.25	$2.50	100万
Grok build 0.1	xAI	$1	$2	26万

※ Gemini 3.1 Proは20万トークン超で入力$4・出力$18に上がる従量制。各モデルの最新の正確な料金は、末尾の各社公式ページで確認してください。

ティアで見ると選びやすい｜4階層の構図

各社のラインナップは「最上位・標準・軽量・超軽量」の4階層でほぼ対応しており、横で比べると相場感がつかめます。

ティア	代表モデル（入力/出力）	向く用途
最上位（最高精度）	GPT-5.5 Pro($30/$180)・Claude Opus 4.8($5/$25)	最難関の推論・重要な意思決定支援
標準（実務の主力）	GPT-5.4($2.50/$15)・Claude Sonnet 4.6($3/$15)・Gemini 3.1 Pro($2/$12)	本番運用の大半・コードや文章生成
軽量（高速・安価）	Claude Haiku 4.5($1/$5)・Gemini 3.5 Flash($1.50/$9)・Grok 4.3($1.25/$2.50)	分類・要約・大量処理
超軽量（最安）	GPT-5.4 nano($0.20/$1.25)・Gemini 3.1 Flash-Lite($0.25/$1.50)	単純タスク・前処理・超大量バッチ

注目はGrok 4.3で、出力が$2.50/100万トークンと標準ティアの性能帯にしては破格。出力が多い用途ではコスト効率が際立ちます。

料金を半減・圧縮する3つの仕組み

表の標準料金は「定価」です。実運用では次の3つで実効コストを大きく下げられます。

仕組み	効果	対応
Batch API（非同期一括）	入力・出力とも50%引き	OpenAI・Anthropic・Google いずれも対応
プロンプトキャッシュ	繰り返す共通プロンプトの入力が大幅割引（Claudeはキャッシュ読み込みが入力の0.1倍）	主要各社が提供
モデルルーティング	難しいタスクだけ上位、簡単なものは軽量に振り分けて総額圧縮	設計で実現

急がない大量処理（分類・要約・評価）はBatchに寄せるだけで半額です。詳しくはChatGPT料金の完全比較や、Claude側のClaude料金全モデル日本円換算もあわせて参照してください。

用途別の選び方｜「最高精度」より「適材適所」

本番運用の主力：標準ティア（GPT-5.4 / Sonnet 4.6 / Gemini 3.1 Pro）。精度とコストのバランスが良い。
大量の分類・要約：軽量ティア（Haiku 4.5 / Gemini Flash / Grok 4.3）＋Batchで最安に。
最難関の推論：最上位（GPT-5.5 Pro / Opus 4.8）。ただし出力が高額なので、ここぞの場面に絞る。
長文を丸ごと扱う：100万トークン対応のClaude各モデル・Grok 4.3が有利。

多くの現場では「全部を最上位で回す」のが最大の無駄です。標準＋軽量を中心に、難所だけ上位に振るのがコスト最適化の定石です。

料金以外で外せない選定軸

軸	見るポイント
コンテキスト長	長い文書・コードベースを丸ごと渡すなら100万トークン対応か
出力単価	生成量が多い用途は「出力$」が効く。Grok 4.3が割安
キャッシュ・Batch対応	実効コストは定価でなく割引込みで比較する
提供形態	API直・クラウド（Bedrock/Vertex）経由で料金や規約が異なる

AI活用、何から始めればいい？

100社以上の研修実績をもとに、30分の無料相談で貴社の課題を整理します。

無料相談はこちら →