コンテンツへスキップ

media AI活用の最前線

【2026年最新】Gemini 3.5 Flash完全解説|料金・比較・活用7選

結論: Gemini 3.5 Flash は Google が2026年5月に正式リリース(GA)した、コーディング・エージェントタスクに特化したマルチモーダルモデルです。1M コンテキスト・$1.50/$9.00 per 1M tokens という料金体系で、Terminal-Bench 2.1(76.2%)ではGemini 3.1 Proを超えるエージェント性能を示します。

この記事の要点:

  • 料金: input $1.50 / output $9.00(per 1M tokens)。無料枠あり(Google AI Studio)
  • コーディング・エージェント性能: Terminal-Bench 2.1 = 76.2%(Gemini 3.1 Proを上回る)
  • 速度: 同世代フロンティアモデル比で約4倍高速(output tokens per second)

対象読者: API活用・エージェント開発を検討中のエンジニア・中小企業のDX担当者
読了後にできること: Gemini 3.5 Flash のAPIを5分でセットアップし、コーディングタスクで試せる

「Gemini 3.1 Pro を使っているけど、もっと速くてコスパのいいモデルはないか」

今年(2026年)5月、そんな疑問に Google が一発で答えを出してきました。Gemini 3.5 Flash の正式リリース(GA)です。正直、最初に数字を見たとき「これは本物か?」と思いました。コーディング・エージェントタスクの主要ベンチマークでGemini 3.1 Proを上回りながら、速度は約4倍、料金も扱いやすいポジションに収まっています。

私が研修・コンサルで関わっている企業の多くが、Claude Code や Codex を使ったエージェント開発で詰まるポイントを抱えています。「コンテキストが足りない」「APIコストが重い」「長い処理が遅い」——Gemini 3.5 Flash はこれらの課題に対して、かなり具体的な答えを持っています。

この記事では、Google公式ブログ・DeepMindモデルカード・複数の独立ベンチマークをもとに、Gemini 3.5 Flash の仕様・料金・競合比較・業務別活用シナリオを完全解説します。API設定のコードサンプルも全部コピペできる形でまとめました。

Gemini 3.5 Flash とは — 2026年5月GA・基本スペック

Gemini 3.5 Flash は Google DeepMind が開発し、2026年5月19日にGA(Generally Available)となったマルチモーダルLLMです。Gemini 3.5シリーズの「Flash」ポジション——つまり「プロ級の知能を、より速くより手軽に」というコンセプトで設計されています。

Google公式ブログ(2026-05-19)では “Frontier-level intelligence at Flash speeds” と説明されています。これは宣伝文句ではなく、主要なエージェントベンチマークで実際に数字が出ています。

基本スペック一覧

項目仕様
モデル名(API)gemini-3.5-flash
リリース日(GA)2026年5月19日
コンテキストウィンドウ1,000,000 tokens(1M)
最大出力トークン64,000 tokens
入力モダリティテキスト・画像・音声・動画
出力テキスト(思考トークン含む)
料金(input)$1.50 / 1M tokens
料金(output)$9.00 / 1M tokens
キャッシュ(input)$0.15 / 1M tokens
無料枠あり(Google AI Studio)
提供プラットフォームGemini API・AI Studio・Android Studio・Vertex AI

出典: Gemini Developer API pricing — Google AI for Developers(参照日: 2026-06-04)

AIエージェントの基本概念や導入ステップについては、AIエージェント導入完全ガイドで体系的にまとめています。Gemini 3.5 Flash はこのエージェントアーキテクチャの「実行エンジン」として非常に強力です。

ベンチマーク詳細 — Gemini 3.1 Proを上回る領域

「Flashなのに Proを超える」と聞いて最初は半信半疑でしたが、ベンチマークを見ると特定の領域では本当にそうなっています。重要なのは「すべてのベンチマークで」ではなく「エージェント・コーディング系で」という限定です。ここが使い分けのカギです。

主要ベンチマーク結果

ベンチマークGemini 3.5 Flash説明
Terminal-Bench 2.176.2%ターミナル操作・コーディング・エージェントタスク。Gemini 3.1 Pro超え
MCP Atlas83.6%(1位)マルチツール連携・Model Context Protocol活用タスク
CharXiv Reasoning84.2%(1位)グラフ・図表の推論理解
Finance Agent v257.9%(1位)金融エージェントタスク
MRCR v2(128k)77.3%長文コンテキスト活用。Claude Opus 4.7の46.9%、GPT-5.5の41.4%を大きく上回る
GDPval-AA1,656 Eloエージェント総合評価。Claude Opus 4.7は1,753 Eloでリード

出典: Google Blog — Gemini 3.5: frontier intelligence with action(参照日: 2026-06-04)DeepMind Model Card — Gemini 3.5 Flash(参照日: 2026-06-04)

注目は長文コンテキスト活用の数字です。MRCR v2(128kトークン)での77.3%は、Claude Opus 4.7(46.9%)やGPT-5.5(41.4%)に対して圧倒的な差をつけています。1Mトークンのコンテキストウィンドウを「持っているだけ」でなく「実際に使えている」という証拠です。

AI活用、何から始めればいい?

100社以上の研修実績をもとに、30分の無料相談で貴社の課題を整理します。

無料相談はこちら AI研修導入40項目チェックリストを受け取る

競合モデル完全比較表 — Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5 vs Gemini 3.1 Pro

「結局どれを使えばいいのか」——この質問を研修先でも顧問先でもよく聞きます。答えは「用途と予算次第」ですが、比較表を見ると選び方の軸が見えてきます。

モデルinput料金
/1M tokens
output料金
/1M tokens
コンテキストTerminal-Bench 2.1速度(output tok/s)強みの領域
Gemini 3.5 Flash$1.50$9.001M76.2%約278エージェント・長文・高速
Gemini 3.1 Pro$1.25$10.001M(Flash未満)総合推論・数学
Claude Opus 4.7$5.00$25.00200k(Flash未満)高度推論・SWE-bench
GPT-5.5128k78.2%エージェントタスク・汎用

出典: Gemini 3.5 Flash vs 2.5 Flash: Real Cost and Performance Comparison(参照日: 2026-06-04)Opus 4.8 vs GPT-5.5 vs Gemini 3.5 Flash: Cost vs Value(参照日: 2026-06-04)

Uravation の判断軸:エージェントタスク・大量文書処理・コーディング補助が主用途なら Gemini 3.5 Flash が最も費用対効果が高いです。逆に SWE-bench レベルの複雑なコード生成・深い推論が必要なら Claude Opus 4.7 が依然リードしています。「まず Gemini 3.5 Flash で試して、難しいタスクだけ重いモデルに回す」というルーティングが現実的な設計です。

Claude CodeとCodex CLIの料金・性能比較についてはCodex CLI vs Claude Code 料金・性能比較2026も参考にしてください。

業務別7活用シナリオ — 実務でどこに使うか

「ベンチマークはわかった。でも実際の業務でどう使うの?」——これが本質的な質問です。1Mトークン・エージェント特化・マルチモーダルという特性を生かせる7つのシナリオを整理しました。

シナリオ1: コーディング補助・コードレビュー

Terminal-Bench 2.1(76.2%)のスコアが示す通り、ターミナル操作を含む実際の開発タスクが得意です。大きなコードベース全体をコンテキストに入れて、リファクタリング方針の提案やレビューができます。


import google.genai as genai

client = genai.Client(api_key="YOUR_API_KEY")

# コードレビューの例
code_to_review = open("main.py").read()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents=f"""
以下のPythonコードをレビューしてください。
- バグの可能性
- パフォーマンス改善点
- セキュリティリスク
- リファクタリング提案

コード:
{code_to_review}
""",
)
print(response.text)

シナリオ2: マルチステップエージェントタスク

MCP Atlas(83.6%・1位)が示す通り、複数ツールを連携させたエージェントタスクが得意です。Google Antigravity との統合でサブエージェント的な処理も可能です。


import google.genai as genai

client = genai.Client(api_key="YOUR_API_KEY")

# Function callingを使ったエージェント的な使い方
tools = [
    {
        "function_declarations": [
            {
                "name": "search_database",
                "description": "データベースから情報を検索する",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "query": {"type": "string", "description": "検索クエリ"},
                        "table": {"type": "string", "description": "テーブル名"}
                    },
                    "required": ["query", "table"]
                }
            }
        ]
    }
]

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="第1四半期の売上データを取得して分析してください",
    config={"tools": tools}
)
print(response.text)

シナリオ3: 大量文書データ分析

1Mトークンのコンテキストを生かした最大の用途の一つです。MRCR v2(77.3%)のスコアは、長文中の情報を正確に引き出す能力を示しています。法律文書・契約書・研究論文・業務マニュアルなど、大量の文書群をまとめて分析できます。


import google.genai as genai

client = genai.Client(api_key="YOUR_API_KEY")

# 複数ドキュメントを一度に処理
documents = []
for filepath in ["contract_a.pdf", "contract_b.pdf", "terms.pdf"]:
    with open(filepath, "rb") as f:
        documents.append(f.read())

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents=[
        "これらの契約書を比較して、異なる条件・注意すべき条項を一覧にしてください。",
        *[{"mime_type": "application/pdf", "data": doc} for doc in documents]
    ],
)
print(response.text)

シナリオ4: 動画・画像の自動分析

マルチモーダル対応(テキスト・画像・音声・動画)を活用した分析が可能です。製品動画のQAチェック・プレゼン資料の内容確認・図表からのデータ抽出などに使えます。


import google.genai as genai

client = genai.Client(api_key="YOUR_API_KEY")

# 動画ファイルを分析
with open("presentation.mp4", "rb") as f:
    video_data = f.read()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents=[
        "このプレゼン動画の内容を要約し、重要なポイントを箇条書きにしてください。",
        {"mime_type": "video/mp4", "data": video_data}
    ],
)
print(response.text)

シナリオ5: 翻訳・多言語コンテンツ処理

高品質な多言語処理と長文コンテキストの組み合わせで、大量の文書翻訳・多言語コンテンツの一括処理が可能です。翻訳の一貫性を保つために、用語集や過去の翻訳例をコンテキストに含めることができます。


import google.genai as genai

client = genai.Client(api_key="YOUR_API_KEY")

# 用語集付き翻訳
glossary = """
専門用語対応表:
- Machine Learning → 機械学習
- Fine-tuning → ファインチューニング
- Inference → 推論(処理)
"""

text_to_translate = open("technical_doc_en.txt").read()

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents=f"""
以下の用語集に従って、英語テキストを日本語に翻訳してください。
専門用語は必ず用語集の訳語を使用してください。

{glossary}

翻訳対象:
{text_to_translate}
""",
)
print(response.text)

シナリオ6: 月次レポート・定型業務の自動化

コスト面($1.50/$9.00 per 1M tokens)を考えると、月次で大量処理が発生する定型業務の自動化に向いています。Finance Agent v2(57.9%・1位)のスコアは金融系の定型処理での強さを示しています。


import google.genai as genai
import json

client = genai.Client(api_key="YOUR_API_KEY")

# CSVデータから月次レポートを自動生成
import csv

monthly_data = []
with open("sales_data_june.csv") as f:
    reader = csv.DictReader(f)
    for row in reader:
        monthly_data.append(row)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents=f"""
以下の6月の売上データを分析して、月次レポートを作成してください。
- 総売上・前月比・目標達成率
- 上位5製品
- 課題と改善提案

データ:
{json.dumps(monthly_data, ensure_ascii=False, indent=2)}
""",
)
print(response.text)

シナリオ7: Vertex AI 経由の企業向けエージェント基盤

個人利用・プロトタイプ段階であれば Gemini API で十分ですが、企業で本番運用する場合は Vertex AI 経由が推奨です。データリージョン制御・アクセス管理・SLAが整います。


import vertexai
from vertexai.generative_models import GenerativeModel

# Vertex AI 初期化
vertexai.init(project="YOUR_PROJECT_ID", location="us-central1")

model = GenerativeModel("gemini-3.5-flash")

# チャット形式でのエージェント
chat = model.start_chat()
response = chat.send_message(
    "今月の顧客サポートログを分析して、よくある問い合わせ上位5件を抽出してください。"
)
print(response.text)

5ステップ導入フロー — 今日から試せる手順

  1. Google AI Studio でAPIキー取得aistudio.google.com にアクセス。Googleアカウントでサインイン後、「Get API key」からキーを生成。無料枠があるため最初のテストはコスト不要
  2. Python SDK インストールpip install google-genai で最新SDK(google-genai)をインストール。旧 google-generativeai は非推奨なので注意
  3. 最初のコード実行(コーディングタスク) — 上記「シナリオ1」のコードを手元のコードで試す。モデル名は gemini-3.5-flash を指定
  4. コスト見積もりと上限設定 — Google AI Studioの「Billing」で月次上限を設定。本番移行前に30日分のトークン使用量を試算する($1.50/$9.00 per 1M tokens で計算)
  5. Vertex AI への移行(本番化) — プロトタイプ検証後、企業利用には Vertex AI への移行を検討。データリージョン・SLA・IAM管理が整うため安心して運用できる

【要注意】失敗パターン3選 — よくある落とし穴

失敗1: リージョン制約を無視してデプロイする

よくある間違い: Gemini API(Google AI Studio)でプロトタイプが動いたため、そのまま本番で使い続ける。個人情報や機密データを処理するケースで、データが日本国内に留まるか確認しないまま運用を開始する。

正しいアプローチ: 個人情報・機密データを処理するならVertex AI(asia-northeast1 = 東京リージョン)を使い、データが日本国内で処理されることを確認する。プライバシーポリシー・社内規程との整合性も確認すること。

なぜ重要か: 個人情報保護法・社内情報セキュリティポリシーの観点から、処理場所を把握せずに使うのはリスクです。Vertex AIならリージョンを指定できます。

失敗2: 「4倍速」の数字をそのまま信じてTTFTを混同する

よくある間違い: 「4倍速」という数字をユーザー体感の応答速度と思い込む。thinking mode(高精度モード)を使った際に、なぜか遅いと感じる。

正しいアプローチ: 「4倍速」は output tokens per second の指標です。high thinking mode では First Token to Output(TTFT)が17〜19秒になるケースがあります。ユーザー向けインターフェースには thinking mode なし or low thinking に設定し、バックグラウンド処理に high thinking を使うという使い分けが実用的です。

失敗3: コンテキスト容量の「持つ」と「使える」を混同する

よくある間違い: 1Mトークンのコンテキストウィンドウがあるからといって、毎回100万トークンを詰め込む設計にする。コストが予想外に膨らむ。キャッシュ設定を忘れる。

正しいアプローチ: キャッシュ機能($0.15/1M tokens)を活用する。システムプロンプト・固定コンテキスト(ドキュメント・コードベース)はキャッシュに乗せ、動的なユーザー入力部分だけを毎回送信する設計にすると、コストを大幅に下げられます。30,000 API呼び出し/月の場合、キャッシュなし約$99、50%キャッシュ活用で約$64まで下がります(出典: Hassan Raza, 2026-06-04)。

失敗4: モデルルーティングを設計しないまま全タスクを1モデルに集中させる

よくある間違い: 「Gemini 3.5 Flash が優秀だから全部これで」という設計。複雑な推論・SWE-benchmark レベルのコード生成でも使い続け、品質が出ない。

正しいアプローチ: タスク難易度に応じてモデルをルーティングする。エージェントタスク・大量文書・コーディング補助 → Gemini 3.5 Flash。高度な推論・複雑なコード生成 → Claude Opus 4.7 or Gemini 3.1 Pro。「最初に安いモデルで試して、失敗したら上位モデルに回す」フォールバック設計がコスト最適です。

実企業の活用事例(公開情報)

事例区分: 公開事例
以下はGoogle公式ブログ(2026-05-19)で公表されている企業事例です。

  • Shopify: データ分析による販売予測の並列処理。複数の予測モデルを並列実行してターンアラウンドを短縮
  • Macquarie Bank: 100ページ以上の契約・文書を読み込んだ顧客オンボーディングの自動化。1Mトークンの長文コンテキストを活用
  • Xero: 複数週にわたる税務処理ワークフローの自動化。マルチステップのエージェントタスクに適用

出典: Google Blog — Gemini 3.5: frontier intelligence with action(参照日: 2026-06-04)

Vertex AI vs Gemini API — 企業はどちらを使うべきか

研修・顧問で「どちらを使えばいい?」という質問が多いので整理します。

項目Gemini API(AI Studio)Vertex AI
対象個人・スタートアップ・プロトタイプ企業・本番運用
無料枠ありなし(従量課金のみ)
データリージョンGoogle管理(指定不可)指定可能(asia-northeast1等)
SLAなし99.9%以上(プラン依存)
IAM・アクセス管理APIキー管理のみGoogle Cloud IAMで細かく制御可
料金$1.50/$9.00 per 1M tokens非グローバルリージョンは+10%程度
セットアップの難易度簡単(APIキー1本)中程度(GCPプロジェクト設定が必要)

個人情報・機密情報を扱う本番システムには Vertex AI を推奨します。プロトタイプ・社内ツール・データ規制のない用途なら Gemini API で十分です。

Node.js / REST API 設定例

Python以外でも使いたい場合のコードサンプルです。


// Node.js(@google/genai SDK)
import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-3.5-flash",
    contents: "Gemini 3.5 Flashの主な特徴を3点で教えてください",
  });
  console.log(response.text);
}

main();

# REST API(curl)
curl -X POST 
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent?key=YOUR_API_KEY" 
  -H "Content-Type: application/json" 
  -d '{
    "contents": [{
      "parts": [{"text": "Gemini 3.5 Flash の料金を教えてください"}]
    }]
  }'

まとめ:今日から始める3つのアクション

Gemini 3.5 Flash は「高速・1Mコンテキスト・エージェント特化」の3点が際立ったモデルです。特に長文処理とマルチステップエージェントタスクでは、より高価なモデルに対しても競争力があります。

  1. 今日やること: Google AI Studio でAPIキーを取得し、gemini-3.5-flash モデルで手元のコードレビューを1回試す(無料枠で可)
  2. 今週中: 現在使っているLLMのAPIコスト(先月分)を計算し、Gemini 3.5 Flash に切り替えた場合の試算を出してみる。同じタスク量で$1.50/$9.00 per 1M tokens に換算
  3. 今月中: 本番移行を検討するなら Vertex AI の設定を試し、データリージョン(asia-northeast1)での動作を確認する。社内のAIガバナンスポリシーとの整合性チェックも同時に実施する

あわせて読みたい:


参考・出典


著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。X(@SuguruKun_ai)フォロワー約10万人。
100社以上の企業向けAI研修・導入支援。著書『AIエージェント仕事術』(SBクリエイティブ)。
SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

ご質問・ご相談は お問い合わせフォーム からお気軽にどうぞ。

佐藤傑
この記事を書いた人 Uravation Lead API Bot
この記事をシェア

Claude Codeを本格的に使いこなしたい方へ

週1回・1時間のマンツーマン指導で、3ヶ月後にはClaude Codeで自走できる実力が身につきます。
現役エンジニアが貴方の業務に合わせてカリキュラムをカスタマイズ。

✓ 1対1のマンツーマン ✓ 全12回・3ヶ月 ✓ 実務ベースの指導
Claude Code 個別指導の詳細を見る まずは無料相談

contact お問い合わせ

生成AI研修や開発のご依頼、お見積りなど、
お気軽にご相談ください。

Claude Code 個別指導(1対1・12セッション)をご希望の方はこちらから別途お申し込みください

FREE DOWNLOAD AI研修導入40項目チェックリスト 資料請求する
Claude Code 個別指導 無料相談