結論: Gemini 3.5 Flash は Google が2026年5月に正式リリース(GA)した、コーディング・エージェントタスクに特化したマルチモーダルモデルです。1M コンテキスト・$1.50/$9.00 per 1M tokens という料金体系で、Terminal-Bench 2.1(76.2%)ではGemini 3.1 Proを超えるエージェント性能を示します。
この記事の要点:
- 料金: input $1.50 / output $9.00(per 1M tokens)。無料枠あり(Google AI Studio)
- コーディング・エージェント性能: Terminal-Bench 2.1 = 76.2%(Gemini 3.1 Proを上回る)
- 速度: 同世代フロンティアモデル比で約4倍高速(output tokens per second)
対象読者: API活用・エージェント開発を検討中のエンジニア・中小企業のDX担当者
読了後にできること: Gemini 3.5 Flash のAPIを5分でセットアップし、コーディングタスクで試せる
「Gemini 3.1 Pro を使っているけど、もっと速くてコスパのいいモデルはないか」
今年(2026年)5月、そんな疑問に Google が一発で答えを出してきました。Gemini 3.5 Flash の正式リリース(GA)です。正直、最初に数字を見たとき「これは本物か?」と思いました。コーディング・エージェントタスクの主要ベンチマークでGemini 3.1 Proを上回りながら、速度は約4倍、料金も扱いやすいポジションに収まっています。
私が研修・コンサルで関わっている企業の多くが、Claude Code や Codex を使ったエージェント開発で詰まるポイントを抱えています。「コンテキストが足りない」「APIコストが重い」「長い処理が遅い」——Gemini 3.5 Flash はこれらの課題に対して、かなり具体的な答えを持っています。
この記事では、Google公式ブログ・DeepMindモデルカード・複数の独立ベンチマークをもとに、Gemini 3.5 Flash の仕様・料金・競合比較・業務別活用シナリオを完全解説します。API設定のコードサンプルも全部コピペできる形でまとめました。
Gemini 3.5 Flash とは — 2026年5月GA・基本スペック
Gemini 3.5 Flash は Google DeepMind が開発し、2026年5月19日にGA(Generally Available)となったマルチモーダルLLMです。Gemini 3.5シリーズの「Flash」ポジション——つまり「プロ級の知能を、より速くより手軽に」というコンセプトで設計されています。
Google公式ブログ(2026-05-19)では “Frontier-level intelligence at Flash speeds” と説明されています。これは宣伝文句ではなく、主要なエージェントベンチマークで実際に数字が出ています。
基本スペック一覧
| 項目 | 仕様 |
|---|---|
| モデル名(API) | gemini-3.5-flash |
| リリース日(GA) | 2026年5月19日 |
| コンテキストウィンドウ | 1,000,000 tokens(1M) |
| 最大出力トークン | 64,000 tokens |
| 入力モダリティ | テキスト・画像・音声・動画 |
| 出力 | テキスト(思考トークン含む) |
| 料金(input) | $1.50 / 1M tokens |
| 料金(output) | $9.00 / 1M tokens |
| キャッシュ(input) | $0.15 / 1M tokens |
| 無料枠 | あり(Google AI Studio) |
| 提供プラットフォーム | Gemini API・AI Studio・Android Studio・Vertex AI |
出典: Gemini Developer API pricing — Google AI for Developers(参照日: 2026-06-04)
AIエージェントの基本概念や導入ステップについては、AIエージェント導入完全ガイドで体系的にまとめています。Gemini 3.5 Flash はこのエージェントアーキテクチャの「実行エンジン」として非常に強力です。
ベンチマーク詳細 — Gemini 3.1 Proを上回る領域
「Flashなのに Proを超える」と聞いて最初は半信半疑でしたが、ベンチマークを見ると特定の領域では本当にそうなっています。重要なのは「すべてのベンチマークで」ではなく「エージェント・コーディング系で」という限定です。ここが使い分けのカギです。
主要ベンチマーク結果
| ベンチマーク | Gemini 3.5 Flash | 説明 |
|---|---|---|
| Terminal-Bench 2.1 | 76.2% | ターミナル操作・コーディング・エージェントタスク。Gemini 3.1 Pro超え |
| MCP Atlas | 83.6%(1位) | マルチツール連携・Model Context Protocol活用タスク |
| CharXiv Reasoning | 84.2%(1位) | グラフ・図表の推論理解 |
| Finance Agent v2 | 57.9%(1位) | 金融エージェントタスク |
| MRCR v2(128k) | 77.3% | 長文コンテキスト活用。Claude Opus 4.7の46.9%、GPT-5.5の41.4%を大きく上回る |
| GDPval-AA | 1,656 Elo | エージェント総合評価。Claude Opus 4.7は1,753 Eloでリード |
出典: Google Blog — Gemini 3.5: frontier intelligence with action(参照日: 2026-06-04)、DeepMind Model Card — Gemini 3.5 Flash(参照日: 2026-06-04)
注目は長文コンテキスト活用の数字です。MRCR v2(128kトークン)での77.3%は、Claude Opus 4.7(46.9%)やGPT-5.5(41.4%)に対して圧倒的な差をつけています。1Mトークンのコンテキストウィンドウを「持っているだけ」でなく「実際に使えている」という証拠です。
競合モデル完全比較表 — Gemini 3.5 Flash vs Claude Opus 4.7 vs GPT-5.5 vs Gemini 3.1 Pro
「結局どれを使えばいいのか」——この質問を研修先でも顧問先でもよく聞きます。答えは「用途と予算次第」ですが、比較表を見ると選び方の軸が見えてきます。
| モデル | input料金 /1M tokens | output料金 /1M tokens | コンテキスト | Terminal-Bench 2.1 | 速度(output tok/s) | 強みの領域 |
|---|---|---|---|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 | 1M | 76.2% | 約278 | エージェント・長文・高速 |
| Gemini 3.1 Pro | $1.25 | $10.00 | 1M | (Flash未満) | 〜 | 総合推論・数学 |
| Claude Opus 4.7 | $5.00 | $25.00 | 200k | (Flash未満) | 〜 | 高度推論・SWE-bench |
| GPT-5.5 | 〜 | 〜 | 128k | 78.2% | 〜 | エージェントタスク・汎用 |
出典: Gemini 3.5 Flash vs 2.5 Flash: Real Cost and Performance Comparison(参照日: 2026-06-04)、Opus 4.8 vs GPT-5.5 vs Gemini 3.5 Flash: Cost vs Value(参照日: 2026-06-04)
Uravation の判断軸:エージェントタスク・大量文書処理・コーディング補助が主用途なら Gemini 3.5 Flash が最も費用対効果が高いです。逆に SWE-bench レベルの複雑なコード生成・深い推論が必要なら Claude Opus 4.7 が依然リードしています。「まず Gemini 3.5 Flash で試して、難しいタスクだけ重いモデルに回す」というルーティングが現実的な設計です。
Claude CodeとCodex CLIの料金・性能比較についてはCodex CLI vs Claude Code 料金・性能比較2026も参考にしてください。
業務別7活用シナリオ — 実務でどこに使うか
「ベンチマークはわかった。でも実際の業務でどう使うの?」——これが本質的な質問です。1Mトークン・エージェント特化・マルチモーダルという特性を生かせる7つのシナリオを整理しました。
シナリオ1: コーディング補助・コードレビュー
Terminal-Bench 2.1(76.2%)のスコアが示す通り、ターミナル操作を含む実際の開発タスクが得意です。大きなコードベース全体をコンテキストに入れて、リファクタリング方針の提案やレビューができます。
import google.genai as genai
client = genai.Client(api_key="YOUR_API_KEY")
# コードレビューの例
code_to_review = open("main.py").read()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"""
以下のPythonコードをレビューしてください。
- バグの可能性
- パフォーマンス改善点
- セキュリティリスク
- リファクタリング提案
コード:
{code_to_review}
""",
)
print(response.text)
シナリオ2: マルチステップエージェントタスク
MCP Atlas(83.6%・1位)が示す通り、複数ツールを連携させたエージェントタスクが得意です。Google Antigravity との統合でサブエージェント的な処理も可能です。
import google.genai as genai
client = genai.Client(api_key="YOUR_API_KEY")
# Function callingを使ったエージェント的な使い方
tools = [
{
"function_declarations": [
{
"name": "search_database",
"description": "データベースから情報を検索する",
"parameters": {
"type": "object",
"properties": {
"query": {"type": "string", "description": "検索クエリ"},
"table": {"type": "string", "description": "テーブル名"}
},
"required": ["query", "table"]
}
}
]
}
]
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="第1四半期の売上データを取得して分析してください",
config={"tools": tools}
)
print(response.text)
シナリオ3: 大量文書データ分析
1Mトークンのコンテキストを生かした最大の用途の一つです。MRCR v2(77.3%)のスコアは、長文中の情報を正確に引き出す能力を示しています。法律文書・契約書・研究論文・業務マニュアルなど、大量の文書群をまとめて分析できます。
import google.genai as genai
client = genai.Client(api_key="YOUR_API_KEY")
# 複数ドキュメントを一度に処理
documents = []
for filepath in ["contract_a.pdf", "contract_b.pdf", "terms.pdf"]:
with open(filepath, "rb") as f:
documents.append(f.read())
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=[
"これらの契約書を比較して、異なる条件・注意すべき条項を一覧にしてください。",
*[{"mime_type": "application/pdf", "data": doc} for doc in documents]
],
)
print(response.text)
シナリオ4: 動画・画像の自動分析
マルチモーダル対応(テキスト・画像・音声・動画)を活用した分析が可能です。製品動画のQAチェック・プレゼン資料の内容確認・図表からのデータ抽出などに使えます。
import google.genai as genai
client = genai.Client(api_key="YOUR_API_KEY")
# 動画ファイルを分析
with open("presentation.mp4", "rb") as f:
video_data = f.read()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=[
"このプレゼン動画の内容を要約し、重要なポイントを箇条書きにしてください。",
{"mime_type": "video/mp4", "data": video_data}
],
)
print(response.text)
シナリオ5: 翻訳・多言語コンテンツ処理
高品質な多言語処理と長文コンテキストの組み合わせで、大量の文書翻訳・多言語コンテンツの一括処理が可能です。翻訳の一貫性を保つために、用語集や過去の翻訳例をコンテキストに含めることができます。
import google.genai as genai
client = genai.Client(api_key="YOUR_API_KEY")
# 用語集付き翻訳
glossary = """
専門用語対応表:
- Machine Learning → 機械学習
- Fine-tuning → ファインチューニング
- Inference → 推論(処理)
"""
text_to_translate = open("technical_doc_en.txt").read()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"""
以下の用語集に従って、英語テキストを日本語に翻訳してください。
専門用語は必ず用語集の訳語を使用してください。
{glossary}
翻訳対象:
{text_to_translate}
""",
)
print(response.text)
シナリオ6: 月次レポート・定型業務の自動化
コスト面($1.50/$9.00 per 1M tokens)を考えると、月次で大量処理が発生する定型業務の自動化に向いています。Finance Agent v2(57.9%・1位)のスコアは金融系の定型処理での強さを示しています。
import google.genai as genai
import json
client = genai.Client(api_key="YOUR_API_KEY")
# CSVデータから月次レポートを自動生成
import csv
monthly_data = []
with open("sales_data_june.csv") as f:
reader = csv.DictReader(f)
for row in reader:
monthly_data.append(row)
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"""
以下の6月の売上データを分析して、月次レポートを作成してください。
- 総売上・前月比・目標達成率
- 上位5製品
- 課題と改善提案
データ:
{json.dumps(monthly_data, ensure_ascii=False, indent=2)}
""",
)
print(response.text)
シナリオ7: Vertex AI 経由の企業向けエージェント基盤
個人利用・プロトタイプ段階であれば Gemini API で十分ですが、企業で本番運用する場合は Vertex AI 経由が推奨です。データリージョン制御・アクセス管理・SLAが整います。
import vertexai
from vertexai.generative_models import GenerativeModel
# Vertex AI 初期化
vertexai.init(project="YOUR_PROJECT_ID", location="us-central1")
model = GenerativeModel("gemini-3.5-flash")
# チャット形式でのエージェント
chat = model.start_chat()
response = chat.send_message(
"今月の顧客サポートログを分析して、よくある問い合わせ上位5件を抽出してください。"
)
print(response.text)
5ステップ導入フロー — 今日から試せる手順
- Google AI Studio でAPIキー取得 — aistudio.google.com にアクセス。Googleアカウントでサインイン後、「Get API key」からキーを生成。無料枠があるため最初のテストはコスト不要
- Python SDK インストール —
pip install google-genaiで最新SDK(google-genai)をインストール。旧 google-generativeai は非推奨なので注意 - 最初のコード実行(コーディングタスク) — 上記「シナリオ1」のコードを手元のコードで試す。モデル名は
gemini-3.5-flashを指定 - コスト見積もりと上限設定 — Google AI Studioの「Billing」で月次上限を設定。本番移行前に30日分のトークン使用量を試算する($1.50/$9.00 per 1M tokens で計算)
- Vertex AI への移行(本番化) — プロトタイプ検証後、企業利用には Vertex AI への移行を検討。データリージョン・SLA・IAM管理が整うため安心して運用できる
【要注意】失敗パターン3選 — よくある落とし穴
失敗1: リージョン制約を無視してデプロイする
❌ よくある間違い: Gemini API(Google AI Studio)でプロトタイプが動いたため、そのまま本番で使い続ける。個人情報や機密データを処理するケースで、データが日本国内に留まるか確認しないまま運用を開始する。
⭕ 正しいアプローチ: 個人情報・機密データを処理するならVertex AI(asia-northeast1 = 東京リージョン)を使い、データが日本国内で処理されることを確認する。プライバシーポリシー・社内規程との整合性も確認すること。
なぜ重要か: 個人情報保護法・社内情報セキュリティポリシーの観点から、処理場所を把握せずに使うのはリスクです。Vertex AIならリージョンを指定できます。
失敗2: 「4倍速」の数字をそのまま信じてTTFTを混同する
❌ よくある間違い: 「4倍速」という数字をユーザー体感の応答速度と思い込む。thinking mode(高精度モード)を使った際に、なぜか遅いと感じる。
⭕ 正しいアプローチ: 「4倍速」は output tokens per second の指標です。high thinking mode では First Token to Output(TTFT)が17〜19秒になるケースがあります。ユーザー向けインターフェースには thinking mode なし or low thinking に設定し、バックグラウンド処理に high thinking を使うという使い分けが実用的です。
失敗3: コンテキスト容量の「持つ」と「使える」を混同する
❌ よくある間違い: 1Mトークンのコンテキストウィンドウがあるからといって、毎回100万トークンを詰め込む設計にする。コストが予想外に膨らむ。キャッシュ設定を忘れる。
⭕ 正しいアプローチ: キャッシュ機能($0.15/1M tokens)を活用する。システムプロンプト・固定コンテキスト(ドキュメント・コードベース)はキャッシュに乗せ、動的なユーザー入力部分だけを毎回送信する設計にすると、コストを大幅に下げられます。30,000 API呼び出し/月の場合、キャッシュなし約$99、50%キャッシュ活用で約$64まで下がります(出典: Hassan Raza, 2026-06-04)。
失敗4: モデルルーティングを設計しないまま全タスクを1モデルに集中させる
❌ よくある間違い: 「Gemini 3.5 Flash が優秀だから全部これで」という設計。複雑な推論・SWE-benchmark レベルのコード生成でも使い続け、品質が出ない。
⭕ 正しいアプローチ: タスク難易度に応じてモデルをルーティングする。エージェントタスク・大量文書・コーディング補助 → Gemini 3.5 Flash。高度な推論・複雑なコード生成 → Claude Opus 4.7 or Gemini 3.1 Pro。「最初に安いモデルで試して、失敗したら上位モデルに回す」フォールバック設計がコスト最適です。
実企業の活用事例(公開情報)
事例区分: 公開事例
以下はGoogle公式ブログ(2026-05-19)で公表されている企業事例です。
- Shopify: データ分析による販売予測の並列処理。複数の予測モデルを並列実行してターンアラウンドを短縮
- Macquarie Bank: 100ページ以上の契約・文書を読み込んだ顧客オンボーディングの自動化。1Mトークンの長文コンテキストを活用
- Xero: 複数週にわたる税務処理ワークフローの自動化。マルチステップのエージェントタスクに適用
出典: Google Blog — Gemini 3.5: frontier intelligence with action(参照日: 2026-06-04)
Vertex AI vs Gemini API — 企業はどちらを使うべきか
研修・顧問で「どちらを使えばいい?」という質問が多いので整理します。
| 項目 | Gemini API(AI Studio) | Vertex AI |
|---|---|---|
| 対象 | 個人・スタートアップ・プロトタイプ | 企業・本番運用 |
| 無料枠 | あり | なし(従量課金のみ) |
| データリージョン | Google管理(指定不可) | 指定可能(asia-northeast1等) |
| SLA | なし | 99.9%以上(プラン依存) |
| IAM・アクセス管理 | APIキー管理のみ | Google Cloud IAMで細かく制御可 |
| 料金 | $1.50/$9.00 per 1M tokens | 非グローバルリージョンは+10%程度 |
| セットアップの難易度 | 簡単(APIキー1本) | 中程度(GCPプロジェクト設定が必要) |
個人情報・機密情報を扱う本番システムには Vertex AI を推奨します。プロトタイプ・社内ツール・データ規制のない用途なら Gemini API で十分です。
Node.js / REST API 設定例
Python以外でも使いたい場合のコードサンプルです。
// Node.js(@google/genai SDK)
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
async function main() {
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Gemini 3.5 Flashの主な特徴を3点で教えてください",
});
console.log(response.text);
}
main();
# REST API(curl)
curl -X POST
"https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent?key=YOUR_API_KEY"
-H "Content-Type: application/json"
-d '{
"contents": [{
"parts": [{"text": "Gemini 3.5 Flash の料金を教えてください"}]
}]
}'
まとめ:今日から始める3つのアクション
Gemini 3.5 Flash は「高速・1Mコンテキスト・エージェント特化」の3点が際立ったモデルです。特に長文処理とマルチステップエージェントタスクでは、より高価なモデルに対しても競争力があります。
- 今日やること: Google AI Studio でAPIキーを取得し、
gemini-3.5-flashモデルで手元のコードレビューを1回試す(無料枠で可) - 今週中: 現在使っているLLMのAPIコスト(先月分)を計算し、Gemini 3.5 Flash に切り替えた場合の試算を出してみる。同じタスク量で$1.50/$9.00 per 1M tokens に換算
- 今月中: 本番移行を検討するなら Vertex AI の設定を試し、データリージョン(asia-northeast1)での動作を確認する。社内のAIガバナンスポリシーとの整合性チェックも同時に実施する
あわせて読みたい:
- AIエージェント導入完全ガイド — エージェント設計の基礎から実装まで
- Codex CLI vs Claude Code 料金・性能比較2026 — コーディング系AIツールの選び方
参考・出典
- Google Blog — Gemini 3.5: frontier intelligence with action — Google(参照日: 2026-06-04)
- Gemini 3.5 Flash — Model Card — Google DeepMind(参照日: 2026-06-04)
- Gemini Developer API pricing — Google AI for Developers(参照日: 2026-06-04)
- Gemini 3.5 Flash vs 2.5 Flash: Real Cost and Performance Comparison for Production AI Tools — Hassan Raza(参照日: 2026-06-04)
- Gemini 3.5 Flash: Google’s Fastest Agentic Model — DataCamp(参照日: 2026-06-04)
- Opus 4.8 vs GPT-5.5 vs Gemini 3.5 Flash: Cost vs Value — Lushbinary(参照日: 2026-06-04)
著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。X(@SuguruKun_ai)フォロワー約10万人。
100社以上の企業向けAI研修・導入支援。著書『AIエージェント仕事術』(SBクリエイティブ)。
SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。
ご質問・ご相談は お問い合わせフォーム からお気軽にどうぞ。



