コンテンツへスキップ

media AI活用の最前線

【2026年最新】Gemini 3 Pro完全ガイド|性能・料金・比較


結論: Gemini 3 Pro(現在は後継のGemini 3.1 Proが主力)は、100万トークン対応・マルチモーダル入力・入力$2/1Mのコスパで、Claude Opus・GPT-5と互角以上の性能を持つGoogleの最強フラッグシップAIです。

この記事の要点:

  • Gemini 3.1 ProはMMLUで91.4%、SWE-bench Verifiedで78.8%を記録し、コーディング性能トップクラス
  • API料金は入力$2/1M(200Kトークン以下)と、Claude Opus比で7分の1という驚異のコスパ
  • 100万トークンのコンテキストウィンドウで、900ページのPDFや1時間動画を一度に処理可能

対象読者: Gemini 3 Proの導入を検討している企業のDX担当者・エンジニア・経営者
読了後にできること: Gemini 3.1 Pro APIをPythonで呼び出し、Claude/GPTとのコスト比較をもとにモデル選定できる


「Gemini 3 Proって結局どのくらい使えるの? ChatGPTやClaudeと比べてどうなの?」

企業向けAI研修で、最近ダントツで増えた質問です。

先日、ある製造業のDX担当者から連絡がありました。「GPT-4oの月額コストが膨らんできた。同等の性能でもっと安いAIに切り替えられないか?」という相談でした。そこでGemini 3.1 Proを紹介し、実際にAPIを組み込んだ試算をしたところ、同じ処理量でコストが約6割削減という結果が出ました。これは本当にびっくりしました。

でも、「Gemini 3 Proって何が違うの?」「Gemini 3.1 Proと何が変わったの?」という混乱も多い。今回は、Googleの公式ドキュメントをベースに、ファクトをきちんと整理した上でお伝えします。

この記事では、Gemini 3 Proシリーズの全体像から料金・ベンチマーク・Claude/GPT-5との比較まで、APIサンプルコードつきで完全解説します。

Gemini 3 Proとは — Googleの最強フラッグシップAI

Gemini 3 Proは、Googleが2025年末に発表したフラッグシップ大規模言語モデルです。「推論・コーディング・マルチモーダル」の3領域で業界最高水準を目指して設計された、Googleの現在のベストモデルです。

ただし、重要なポイントがあります。オリジナルの「Gemini 3 Pro Preview」(モデルID: gemini-3-pro-preview)は2026年3月9日に廃止されました。現在の主力は後継モデルの「Gemini 3.1 Pro Preview」(モデルID: gemini-3.1-pro-preview)です。

AIエージェントの基本概念や導入ステップについては、AIエージェント導入完全ガイドで体系的にまとめています。

Gemini 3シリーズのラインナップ

モデル主な用途状態
Gemini 3 Pro Previewフラッグシップ・推論廃止(2026年3月9日)
Gemini 3.1 Pro Previewフラッグシップ・推論(最新版)現役・推奨
Gemini 3 Flash Preview高速・コスト最適化現役
Gemini 3 Pro Image Previewテキスト+画像生成現役
Gemini 3.1 Flash-Lite最軽量・最安コスト現役

研修先では「Gemini 3 Pro」と「Gemini 3.1 Pro」を混同しているケースが非常に多いです。現時点で使うべきはGemini 3.1 Proです。本記事では「Gemini 3 Pro系」として両方を含めて解説します。

性能ベンチマーク — 主要AIモデルとの比較

Gemini 3.1 Proの実力を数字で確認します。以下は2026年4月時点の主要ベンチマーク比較です(出典: Vellum AI、Artificial Analysis、各公式発表)。

ベンチマークGemini 3.1 ProClaude Opus 4.6GPT-5.4評価内容
MMLU91.4%91.8%90.5%知識・推論の総合力
MMLU-Pro(難易度高)89.8%応用的知識の活用力
SWE-bench Verified78.8%実際のバグ修正能力
GPQA Diamond94.3%PhD水準の科学知識
MMMU-Pro(マルチモーダル)81.0%76.0%画像+テキスト理解

注目ポイント: MMLUではClaude Opus 4.6が91.8%でわずかに上ですが、コーディングのSWE-bench Verifiedではトップクラスのスコアを記録。マルチモーダル(MMMU-Pro)ではGPT-5.4を5ポイント超上回るという結果が出ています。

特に個人的に注目しているのはGPQA Diamondの94.3%です。これはPhDレベルの科学的知識が問われるベンチマークで、研究開発部門への応用可能性の高さを示しています。

AI活用、何から始めればいい?

100社以上の研修実績をもとに、30分の無料相談で貴社の課題を整理します。

無料相談はこちら 資料ダウンロード(無料)

主要仕様 — コンテキスト・モダリティ・機能

Gemini 3.1 Pro Previewの仕様(2026年4月現在・公式ドキュメント準拠)

仕様項目
モデルIDgemini-3.1-pro-preview
入力コンテキスト上限1,048,576トークン(約100万)
出力トークン上限65,536トークン
入力モダリティテキスト・画像・動画・音声・PDF
出力モダリティテキストのみ
知識カットオフ2025年1月

100万トークンというコンテキストウィンドウは、900ページのPDF、8.4時間の音声、1時間の動画を一度に処理できる規模です。大規模なコードベースや長大なドキュメントをまとめて分析したい場合に、他のモデルとは一線を画した強みがあります。

サポート機能一覧

  • Batch API(大量処理の非同期実行)
  • コンテキストキャッシング(コスト最大90%削減)
  • コード実行(Pythonサンドボックス内で実行・結果返却)
  • 関数呼び出し(Function Calling)
  • 検索グラウンディング(Googleリアルタイム検索との連携)
  • 構造化出力(JSONスキーマ指定)
  • 思考機能(thinking_level): low / medium / high / max の4段階
  • URLコンテキスト(URLを直接プロンプトに含める)
  • Flex / Priority inference(負荷分散・優先処理の切り替え)

「思考機能(thinking_level)」は、Gemini 3.1 Proの目玉機能のひとつです。mediumという中間設定が3.1で新たに追加され、「高速は不要だが最大推論を待てない」というビジネス実務のニーズにちょうど合うポジションができました。

料金とAPI — コスパ最強の衝撃

Gemini 3.1 Pro Preview APIの料金(2026年4月現在)

項目200Kトークン以下200Kトークン超
入力(1Mトークン)$2.00$4.00
出力(1Mトークン)$12.00$18.00
思考(Reasoning)トークン出力と同率($12.00)出力と同率($18.00)

主要モデルとの料金比較(入力コスト/1Mトークン)

モデル入力料金/1M出力料金/1Mコンテキスト無料枠
Gemini 3.1 Pro$2.00$12.00100万トークンAI Studio(無料)
Claude Opus 4.6$15.00$75.0020万トークンなし
GPT-5.4(参考)$10.00前後$30.00前後100万トークンなし
Gemini 3 Flash$0.075$0.30100万トークンAI Studio(無料)

Claude Opus 4.6比で入力コストが7.5分の1、出力コストが6.25分の1というのは本当に衝撃的です。もちろんすべての用途でGeminiが最適というわけではありませんが、大量処理・長文処理が必要な場面では圧倒的なコスト優位があります。

無料で試す方法

Google AI Studio(ai.google.dev)ではGemini 3.1 ProをUI上で無料体験できます。ただし、APIキー経由での商用利用には課金が必要です。無料APIアクセスはGemini 2.5系のモデルが対象です。

Claude/GPT-5との3モデル徹底比較

用途別おすすめ早見表

用途最適モデル理由
長文ドキュメント処理(100万字超)Gemini 3.1 Pro100万トークン対応が最も実用的
コーディング・バグ修正(複雑)Gemini 3.1 ProSWE-bench 78.8%でトップクラス
マルチモーダル(動画・音声分析)Gemini 3.1 Pro唯一の真のネイティブ5モダリティ対応
文章作成・クリエイティブライティングClaude Opus 4.6人間の嗜好評価で依然トップ
コスト最適化・大量API呼び出しGemini 3 Flash$0.075/1Mという圧倒的安さ
コンピュータ操作・PC自動化GPT-5.4Computer Use系の性能が最高

研修の場でよく聞かれるのが「結局どれを使えばいいの?」という質問ですが、正直に言えば1つのモデルに絞る必要はないです。予算があるなら用途別に使い分けるのがベストプラクティス。ただし「まず1つ選ぶなら」という文脈では、コスパと性能のバランスからGemini 3.1 Proをおすすめするケースが増えています。

推論速度(レイテンシ)比較

モデル推論速度(目安)備考
Gemini 3.1 Pro(thinking low)比較的速いthinking_level=lowで応答速度優先
Gemini 3.1 Pro(thinking max)比較的遅い最大推論で精度最大化
Claude Opus 4.6中程度Extended Thinkingモード時は遅い
GPT-5.4速いストリーミング対応で体感は速め

Pythonで実装するサンプルコード

顧問先のスタートアップで実際にGemini 3.1 Pro APIを組み込んだ際のコードを整理しました。ぜひそのままコピーして試してみてください。

基本的な呼び出し(テキスト生成)

pip install google-genai --upgrade
from google import genai
from google.genai import types

# APIキー設定
client = genai.Client(api_key="YOUR_GEMINI_API_KEY")

# 基本的なテキスト生成
response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="AIを活用した業務効率化の具体的な手順を5ステップで教えてください。",
    config=types.GenerateContentConfig(
        temperature=0.7,
        max_output_tokens=2048,
    )
)

print(response.text)
# 不足している情報があれば、最初に質問してから作業を開始してください。

思考機能(Thinking)を使った高精度推論

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_GEMINI_API_KEY")

# thinking_levelで推論深度を制御
response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="""
    我々のSaaS製品の月次チャーン率が3.5%から5.2%に上昇しています。
    考えられる原因と、それぞれの優先度・対策を論理的に分析してください。
    仮定した点は必ず「仮定」と明記してください。
    """,
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(
            thinking_budget="medium"  # low / medium / high / max
        )
    )
)

print(response.text)

長文PDFの一括分析(100万トークン活用)

from google import genai
import pathlib

client = genai.Client(api_key="YOUR_GEMINI_API_KEY")

# PDFファイルを読み込み
pdf_path = pathlib.Path("annual_report_900pages.pdf")
pdf_data = pdf_path.read_bytes()

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents=[
        {
            "inline_data": {
                "mime_type": "application/pdf",
                "data": pdf_data
            }
        },
        "このPDFから、財務リスク要因を抜き出し、重要度順にまとめてください。"
        "数字と固有名詞は、根拠(出典/計算式)を添えてください。"
    ]
)

print(response.text)

関数呼び出し(Function Calling)エージェント基礎

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_GEMINI_API_KEY")

# ツール定義
tools = [
    types.Tool(
        function_declarations=[
            types.FunctionDeclaration(
                name="search_company_db",
                description="社内データベースから企業情報を検索する",
                parameters=types.Schema(
                    type="object",
                    properties={
                        "company_name": types.Schema(
                            type="string",
                            description="検索する企業名"
                        )
                    },
                    required=["company_name"]
                )
            )
        ]
    )
]

# エージェント的な呼び出し
response = client.models.generate_content(
    model="gemini-3.1-pro-preview-customtools",  # カスタムツール用エンドポイント
    contents="株式会社ABCの決算情報を調べて、要約してください。",
    config=types.GenerateContentConfig(tools=tools)
)

# 関数呼び出しの検出
for candidate in response.candidates:
    for part in candidate.content.parts:
        if part.function_call:
            print(f"呼び出し関数: {part.function_call.name}")
            print(f"引数: {part.function_call.args}")

ChatGPTやClaudeの導入事例と比較については、ChatGPTビジネス活用完全ガイドも参照してください。

エージェント開発でのGemini 3 Pro活用

Gemini 3.1 Proはエージェント(自律的なタスク実行AI)の基盤として特に優れています。

Gemini 3 Proのエージェント機能の特徴

  • コード実行サンドボックス: Pythonを書いて実行し、結果を解釈するサイクルを自律的に繰り返す
  • ファイル検索: アップロードされたドキュメントをRAG的に参照する
  • 検索グラウンディング: Googleリアルタイム検索と連携し、最新情報に基づいて回答する
  • マルチモーダルエージェント: 画像・動画・音声を受け取って処理するエージェントを構築可能

研修先のEC企業で実際に試した事例を紹介します(想定シナリオ・守秘義務のため詳細を変更)。

> 事例区分: 想定シナリオ
> 以下は50社以上のAI研修・導入支援の経験をもとに構成した典型的なシナリオです。

商品カタログPDF(300ページ超)をGemini 3.1 Proにアップロードし、「お客様からの問い合わせに自動回答するエージェント」を構築。従来は担当者が1問ずつ調べていた作業が、90%以上を自動化できるという試算が出ました。コンテキスト100万トークンのおかげで、カタログ全文を一度にモデルに渡せるのが決め手でした。

【要注意】よくある失敗パターンと回避策

失敗1: 廃止モデル(gemini-3-pro-preview)を使い続ける

❌ 古いモデルIDをそのまま使う

model="gemini-3-pro-preview"  # 2026年3月9日に廃止済み

⭕ 最新の3.1 Proに切り替える

model="gemini-3.1-pro-preview"  # 現在の主力モデル

なぜ重要か: 廃止後もAPIは一時的に応答する場合がありますが、予期しないエラーや挙動変化が起きます。マイグレーションは早めに完了させること。

失敗2: 思考トークンのコストを無視する

❌ thinking_levelをmaxに設定したまま本番運用

thinking_config=types.ThinkingConfig(thinking_budget="max")
# 思考トークンが大量発生してコストが10倍以上になる

⭕ 用途に応じてthinking_levelを調整する

# ルーティン作業 → low(コスト最小)
# ビジネス分析 → medium(バランス型)
# 複雑な推論 → high or max(精度最大)

なぜ重要か: 思考(Reasoning)トークンは出力と同料金で課金されます。不必要にmaxを使うとコストが急増します。

失敗3: 200Kトークン超の料金を見落とす

❌ 大量のコンテキストを入れて費用計算を誤る

1件のプロンプトで300Kトークンを使うと、入力料金が$2から$4/1Mに倍増します。
月10万件の処理をする場合、この差は無視できません。

⭕ コンテキストキャッシングで重複部分を削減する

システムプロンプト(会社ルール、マニュアルなど)が固定の場合、キャッシングで最大90%のコスト削減が可能です。

失敗4: マルチモーダル処理でファイルサイズを無視する

❌ 1GBの動画ファイルをそのまま送ろうとする
⭕ 動画は必要な部分だけ切り出してから送る(30分以内を推奨)

なぜ重要か: ファイルサイズが大きいほどアップロード時間とレイテンシが増加します。また、処理できるトークン上限(100万)を超えると切り捨てが発生します。

用途別おすすめ:あなたはどのモデルを選ぶべき?

Gemini 3.1 Proを選ぶべきケース

  • 月間APIコールが多く(10万件以上)コスト削減が優先課題
  • 100ページ超の文書・レポートをまとめて処理したい
  • コーディングエージェントや自律的なバグ修正AIを構築したい
  • 動画・音声・PDFを横断したマルチモーダル分析が必要
  • 検索グラウンディングでリアルタイム情報が必要

Claude Opus 4.6を選ぶべきケース

  • 文章のクオリティ・創造性が最優先(マーケ、PR、営業文書)
  • 人間的な会話のナチュラルさが重要な用途
  • ExtendedThinkingで超複雑な分析・推論が必要

GPT-5.4を選ぶべきケース

  • PC操作の自動化・コンピュータユース系のタスク
  • OpenAIエコシステム(Assistants API・Codex等)との統合が前提

Gemini 3 Flashを選ぶべきケース

  • 大量の軽量タスク(要約、分類、抽出)でコストを極限まで下げたい
  • リアルタイム性が必要なチャットボット・カスタマーサポート

FAQ — よくある質問

Q: Gemini 3 ProとGemini 3.1 Proはどう違いますか?

A: Gemini 3 Pro Preview(gemini-3-pro-preview)は2026年3月9日に廃止された旧モデルです。現在の推奨モデルはGemini 3.1 Pro Preview(gemini-3.1-pro-preview)です。3.1では「thinking_level=medium」という新しい推論段階が追加され、SWE-benchなど複数のベンチマークでスコアが向上しています。

Q: Google AI Studioで無料で使えますか?

A: はい、Google AI Studio(ai.google.dev)のUI上では無料で試用できます。ただし、APIキー経由でのプログラム的な商用利用には課金が必要です。無料APIアクセスはGemini 2.5系モデルが対象です。

Q: 日本語の精度はどうですか?

A: Gemini 3.1 ProはGPT-5.4・Claude Opus 4.6と同様に日本語を強力にサポートしており、ビジネス文書・翻訳・要約において実用レベルの精度があります。研修で比較した感覚では、長文日本語の理解力はほぼ横並びです。微妙なニュアンスや文化的文脈ではClaudeがやや上という評価が多いですが、コスパを考えると十分です。

Q: 既存のOpenAI/Claudeのコードから移行するのは大変ですか?

A: google-genai SDK(v1.51.0以降)を使えば比較的スムーズに移行できます。基本的な呼び出し構造(client.models.generate_content)はシンプルで、既存のPromptやシステム設定を移植するだけの場合は1〜3日で完了するケースが多いです。

Q: 企業での商用利用に制限はありますか?

A: 通常のビジネス用途(文書処理・コーディング・分析)には制限はありません。ただし、Googleのサービス利用規約に定める禁止事項(違法コンテンツ生成など)には従う必要があります。また、医療・金融など規制業種での利用は各国の法規制を別途確認してください。

Q: Vertex AI(Google Cloud)経由と直接APIどちらがいいですか?

A: 小規模・個人開発者なら直接API(ai.google.dev)が手軽です。企業規模での本番運用では、VPC内で使えるVertex AI経由の方がセキュリティ・SLA・監査ログの観点でおすすめです。

参考・出典


まとめ:今日から始める3つのアクション

  1. 今日やること: Google AI Studioで無料アカウントを作成し、Gemini 3.1 ProのUIを試す(5分)
  2. 今週中: 既存業務の一つ(長文文書要約・コード生成・PDF分析のどれか)でAPIを試し、Claude/GPTとコスト・品質を比較する
  3. 今月中: 本番運用のAPIコスト試算表を作成し、モデル選定を決定する(コンテキストキャッシングの有無もシミュレーション)

AI導入のモデル選定や費用対効果の計算については、AI導入戦略完全ガイドも参考にしてください。

ご質問・ご相談は お問い合わせフォーム からお気軽にどうぞ。


著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー約10万人)。100社以上の企業向けAI研修・導入支援を展開。著書『AIエージェント仕事術』(SBクリエイティブ)。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

佐藤傑
この記事を書いた人 佐藤傑

株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー10万人超)。100社以上の企業向けAI研修・導入支援を展開。著書累計3万部突破。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

この記事をシェア

Claude Codeを本格的に使いこなしたい方へ

週1回・1時間のマンツーマン指導で、3ヶ月後にはClaude Codeで自走できる実力が身につきます。
現役エンジニアが貴方の業務に合わせてカリキュラムをカスタマイズ。

✓ 1対1のマンツーマン ✓ 全12回・3ヶ月 ✓ 実務ベースの指導
Claude Code 個別指導の詳細を見る まずは無料相談

contact お問い合わせ

生成AI研修や開発のご依頼、お見積りなど、
お気軽にご相談ください。

Claude Code 個別指導(1対1・12セッション)をご希望の方はこちらから別途お申し込みください

Claude Code 個別指導 無料相談