結論: DeepSeek V4は2026年4月24日にPreviewとして正式公開。V4-Pro(1.6Tパラメータ)はGPT-5.5の8.6倍安い出力コスト($3.48 vs $30/M tokens)でCodeforces 3206という競合最高スコアを達成。MIT/Apache 2.0ライセンスで即日APIが使えます。
この記事の要点:
- 要点1: V4-Pro(1.6T/49B active)とV4-Flash(284B/13B active)の2モデル体制。どちらも100万トークンコンテキスト対応
- 要点2: V4-Pro出力コストはGPT-5.5の1/8.6・Claude Opus 4.7の1/21と圧倒的に安い
- 要点3: Codeforces 3206はGPT-5.4(3168)を超えるが、GPT-5.5・Gemini 3.1 Proとの差も正直に解説
対象読者: コスト効率を重視してAIを活用したいIT担当者・事業責任者
読了後にできること: DeepSeek V4の自社適合性を評価し、GPT-5.5・Claude Opus 4.7との使い分け判断ができる
「DeepSeek V4、正式リリースされましたよね。実際どうなんですか?」
4月24日以降、この質問が一気に増えました。DeepSeek V3/R1が話題になってから約1年。待ちに待ったV4のPreviewが公開されて、企業のAI担当者から「試すべきか」「データは安全か」という問い合わせが続いています。
2026年4月時点でDeepSeek V4を見て思ったのは「性能と価格のバランスは実際すごい、でも万能ではない」です。Codeforces 3206でGPT-5.4を超えたのは本物の成果ですが、GPT-5.5との差は「3〜6ヶ月遅れのフロンティア」と研究者も認めている。この現実を踏まえた上で、どう使うかが企業の判断軸になります。
DeepSeek V4正式Preview公開の概要(2026年4月24日)
DeepSeek AIは2026年4月24日、X(旧Twitter)で正式にV4シリーズのPreview公開を発表しました。Hugging FaceとOpenRouterで即日テストが可能で、APIも当日から提供されています。
2モデル体制の全貌
| 項目 | DeepSeek V4-Pro | DeepSeek V4-Flash |
|---|---|---|
| 総パラメータ | 1.6兆(1.6T) | 2,840億(284B) |
| アクティブパラメータ | 490億(49B)/トークン | 130億(13B)/トークン |
| アーキテクチャ | MoE(Mixture of Experts) | MoE(独立訓練) |
| コンテキスト長 | 100万トークン | 100万トークン |
| 最大出力トークン | 384,000 | 384,000 |
| Thinkingモード | 3段階(Low/Medium/High) | 3段階 |
| API入力料金 | $1.74/M tokens | $0.14/M tokens |
| API出力料金 | $3.48/M tokens | $0.28/M tokens |
| ライセンス | MIT(ウェイト公開) | Apache 2.0 |
| ウェイトサイズ | 865GB | 160GB |
重要: 現時点は「Preview」公開。正式版リリースは2026年5月〜6月予定とされています。V3シリーズのAPIは2026年7月24日に終了予定。
技術的な革新点
V4の最大の技術的特徴は「Compressed Sparse Attention(CSA)」と「Heavily Compressed Attention(HCA)」の組み合わせです。100万トークンのコンテキスト処理で、DeepSeek V3.2比で推論FLOPsを27%に、KVキャッシュを10%に削減しています。
実務的な意味合い: 長い文書を処理する際のコストが大幅に下がります。1Mトークンのコンテキストを使い切るコストが、以前より格段に低くなっています。
AIエージェントの基本概念や企業導入の考え方については、AIエージェント導入完全ガイドで体系的にまとめています。
ベンチマーク最新値 — GPT-5.5・Claude Opus 4.7との正直な比較
主要ベンチマーク比較表(2026年4月時点)
| ベンチマーク | DeepSeek V4-Pro | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Codeforces(競技プログラミング) | 3206 ★ | — | — | — |
| LiveCodeBench | 93.5 | — | — | — |
| SWE-bench Verified | 〜81% | 88.7% | 87.6% | 80.6% |
| Chinese-SimpleQA | 84.4 ★(閉域モデル除き最高) | — | — | — |
| MMLU(一般知識) | — | 92.4% | 91.8% | 90.99% |
| FrontierMath Tier 4 | — | 39.6%(Pro) | 22.9% | — |
| コンテキスト長 | 1M | 128K〜1M | 1M/128K出力 | 2M(Vertex) |
★ 注記: Codeforcesでは3206(GPT-5.4の3168を超える)が実測値ですが、GPT-5.5のスコアは現時点で非公開。SWE-bench V4-Pro(81%)はV4-Flashの数値も含む暫定値で、公式独立検証は進行中。
研究者の評価:「フロンティアより3〜6ヶ月遅れ」
DeepSeek V4-Proについて、Simon Willison(著名なAI研究者・Djangoコア開発者)は「almost on the frontier, a fraction of the price(フロンティアに近い、はるかに安い価格)」と表現しています。論文では「GPT-5.4・Gemini 3.1 Proをわずかに下回るが、開発軌跡はフロンティアより約3〜6ヶ月遅れ」と正直に認めています。
これは批判ではなく、文脈として重要です。3〜6ヶ月遅れで8倍安いなら、多くのユースケースでV4-Proが最善の選択になります。
料金比較 — コスト優位の本当の大きさ
API料金比較表(2026年4月時点)
| モデル | 入力(/M tokens) | 出力(/M tokens) | GPT-5.5比(出力) |
|---|---|---|---|
| DeepSeek V4-Flash | $0.14 | $0.28 | 1/107 |
| DeepSeek V4-Pro | $1.74 | $3.48 | 1/8.6 |
| Gemini 3.1 Pro | $2.00 | $12.00 | 1/2.5 |
| Claude Opus 4.7 | $5.00 | $25.00 | 1/1.2 |
| GPT-5.5 | $5.00 | $30.00 | 基準 |
| GPT-5.5 Pro | $30.00 | $180.00 | 6倍 |
月間コスト試算(入力1億・出力2000万トークン処理の場合)
| モデル | 月間コスト | GPT-5.5比 |
|---|---|---|
| DeepSeek V4-Flash | $14 + $5.6 = $19.6 | 98%削減 |
| DeepSeek V4-Pro | $174 + $69.6 = $243.6 | 78%削減 |
| Gemini 3.1 Pro | $200 + $240 = $440 | 60%削減 |
| Claude Opus 4.7 | $500 + $500 = $1,000 | 9%削減 |
| GPT-5.5 | $500 + $600 = $1,100 | 基準 |
V4-Flashの98%削減は衝撃的な数字です。ただし「98%安いなら全部FlashにしろK」という結論ではありません。後述する用途別比較で判断することが重要です。
企業利用時の注意点——中国発AIモデルの評価基準(2026年4月更新)
「データは安全か?」という質問は変わらず重要です。DeepSeek V4がPreview公開された今も、データ主権の考え方は変わりません。
APIを使う場合のデータリスク
DeepSeek APIを使う場合、入力したプロンプト・データが中国のサーバーで処理されます。以下のデータの送信は避けるべきです:
- 個人情報(顧客情報・従業員情報)
- 企業の未公開財務情報・M&A関連情報
- 政府機関・防衛関連の情報(多くの国・機関で法規制あり)
- 知的財産・営業秘密
セルフホスティング(ウェイト公開の活用)
DeepSeek V4はMIT/Apache 2.0ライセンスでウェイトを公開しています。これは「自社サーバーで動かすことで、データを一切外部に出さない」選択肢があることを意味します。
現実的な制約:
- V4-Pro全量ホスティング: 865GBのウェイト + 推論に大量のGPU(H100×16枚以上のクラスタが目安)
- V4-Flash: 160GB、H100×2〜4枚程度で動作可能
- 量子化版(4bit/8bit): さらに小さいGPUでの実行が可能だが、品質が低下する場合あり
大企業でGPUクラスタを既に持っている場合は、セルフホスティングがAPIコストとセキュリティリスクの両方を解決します。研修先の金融機関(従業員2000名規模)では、V4-FlashをオンプレH100×4枚で動かすPOCを進めているケースがあります。
規制対応の観点(2026年4月時点)
| 地域/機関 | 状況 |
|---|---|
| 米国連邦機関 | DeepSeekの政府ネットワーク使用禁止(2026年初頭〜) |
| 欧州(一部国) | GDPR整合性調査中。イタリア・ルーマニアで調査あり |
| 日本 | 現時点で政府の明確な禁止なし。個人情報保護法の観点から社内ガイドラインで判断 |
| 一般企業 | 業種・データ機密度により個別判断 |
DeepSeek V4 vs GPT-5.5 vs Claude Opus 4.7:用途別おすすめ
| 用途 | おすすめ | 理由 |
|---|---|---|
| 競技プログラミング・アルゴリズム | V4-Pro | Codeforces 3206で競合最高スコア |
| 大量バッチ処理(非機密) | V4-Flash | GPT-5.5の107分の1のコスト |
| 数学的推論・財務モデリング | GPT-5.5 Pro | FrontierMath Tier4 39.6%(V4は非公開だが差がある見通し) |
| 機密情報を含む処理 | V4セルフホスティング or GPT-5.5/Claude API | データ主権の観点 |
| コーディングエージェント | GPT-5.5 + Codex | Terminal-Bench 82.7%・エージェント統合が最も進んでいる |
| 社内オンプレ運用 | V4-Flash(セルフホスト) | Apache 2.0ライセンス+160GBで運用可能 |
| 長文書類処理(公開情報) | V4-Pro or Gemini 3.1 Pro | 両者とも100万トークン超対応。コストはV4が安い |
V4のアーキテクチャ革新 — なぜ安くて高性能なのか
「中国のAIがなぜこんなに安いのか」という疑問は自然です。V4の価格優位の背景には、3つの技術的革新があります。
革新1: Compressed Sparse Attention(CSA)+ Heavily Compressed Attention(HCA)
通常のAttention機構は、全トークン間の計算(O(n²))が必要です。V4は「重要なトークンペア」のみに計算を集中させ、1Mトークンのコンテキストでも「V3.2の10% KVキャッシュ、27%のFLOPs」で同等の品質を実現します。
実務での意味: 長い文書を一括処理するコストが、前世代比で大幅に削減されています。V4-Flashで100万トークンを処理しても、V3.2比でGPU負荷・時間が大幅に短縮されます。
革新2: 独立訓練MoE(V4-Flash)
V4-FlashはV4-Proとは独立して訓練されています。単純に「大きいモデルを圧縮した小型版」ではなく、Flashの用途(高速・低コスト処理)に最適化して一から訓練されています。これにより、同規模の他社軽量モデルと比べてFlashの品質が高い理由になっています。
革新3: 3段階Thinkingモード(Low/Medium/High)
V4はタスクの複雑さに応じて「どれだけ深く考えるか」を調整できます。簡単な質問はLowモードで素早く回答、難しい数学・コーディング問題はHighモードで精度を優先。「常に最大推論を使う」ではなく、コストと精度のバランスを動的に最適化できます。
## Thinkingモード選択のガイドライン
Low(高速・低コスト): 単純な質問・FAQ対応・短文生成
Medium(標準): コンテンツ生成・コードレビュー・通常の分析
High(精度優先): 複雑なアルゴリズム・数学的推論・多段階問題
使い分け例:
- カスタマーサポートボット → Low(レスポンス速度優先)
- コードレビューシステム → Medium
- 財務モデリング・設計問題 → High実際に試してみるためのプロンプト
V4-Flash(コスト重視バッチ処理向け)
## 大量ドキュメント要約プロンプト(V4-Flash向け)
以下の複数のドキュメントを分析し、統合サマリーを作成してください。
ドキュメント1: [テキスト]
ドキュメント2: [テキスト]
ドキュメント3: [テキスト]
出力形式:
1. 各ドキュメントの主要ポイント(箇条書き3点ずつ)
2. 共通テーマ・矛盾点
3. 300字以内の総合サマリー
不足情報があれば最初に質問してから作業を開始してください。V4-Pro(競技プログラミング・高精度コーディング向け)
## アルゴリズム設計プロンプト(V4-Pro向け)
以下の問題に対して最も効率的なアルゴリズムを設計してください。
問題: [問題を記述]
要求事項:
- 時間計算量と空間計算量の分析
- 複数のアプローチの比較(少なくとも2案)
- 推奨アプローチの理由と実装例(Python)
- エッジケースの列挙
仮定した点は必ず「仮定」と明記してください。コスト比較テストプロンプト(どのモデルを選ぶか検討時)
## 自社AIモデル選定プロンプト
以下の条件を踏まえて、DeepSeek V4とGPT-5.5・Claude Opus 4.7の
コスト試算と適合性評価をしてください。
月間処理量: [Xトークン]
主要ユースケース: [処理内容]
データの機密度: [高/中/低]
GPU所有状況: [有/無]
出力:
1. 各モデルの月間コスト試算
2. データ主権リスク評価
3. 推奨構成とその理由【要注意】DeepSeek V4活用の失敗パターン
失敗1:「安いから」だけで機密データも送る
❌ コスト削減のため、機密情報を含むワークフローもDeepSeek APIに切り替える
⭕ ユースケースごとにデータの機密度を評価し、非機密データのみAPIを使用する
なぜ重要か: V4-Flashの$0.28/Mというコストは魅力的ですが、情報漏洩リスクはコスト削減で帳消しにできません。セルフホスティングか、信頼できる欧米プロバイダーのAPIか、用途で使い分けることが正解です。
失敗2:「Preview」を正式版と同様に本番投入する
❌ 4月24日のPreview公開を受けて、即座に本番ワークフローを組み替える
⭕ Preview期間中は検証・POCに限定し、正式版リリースを待って本番化判断する
なぜ重要か: Preview公開からは仕様変更、API安定性、ベンチマークの独立検証が進む期間です。正式版リリース前に重要なワークフローを依存させると、仕様変更時に対応コストが膨らみます。
失敗3:V4-Flashを全用途のデフォルトにする
❌ 「Flashが最安だから全部Flashにする」と判断する
⭕ 精度要件が高い処理(コード生成・専門文書レビュー)はV4-ProかGPT-5.5/Claudeを使い分ける
なぜ重要か: V4-FlashとV4-Proはアーキテクチャが独立して訓練されており、難易度の高いタスクではFlashとProの品質差が出ます。「全部Flashでいい」という判断は、品質テストで確認してからにすること。
失敗4:V4と競合他社の差を過大/過小評価する
❌ 「Codeforces 3206でGPT-5.4超え」という数字だけ見て「GPT-5.5も超えた」と思い込む
⭕ GPT-5.5のCodeforcesスコアは未公開。他のベンチマーク(FrontierMath Tier4・Terminal-Bench)ではGPT-5.5が明確に優位
なぜ重要か: ベンチマーク1つでの優位は「そのベンチマークで優れている」であって「全面的に優れている」ではありません。競技プログラミングに特化したユースケースではV4が優れますが、数学的推論・エージェント業務ではGPT-5.5が優位です。
V4-FlashとV4-Proの使い分け実践ガイド
「V4-ProとFlashどっちを使えばいいか」という質問が一番多く来ています。判断基準は3つです。
判断基準1: タスクの複雑さ
定型的な文書処理・要約・FAQ対応はFlashで十分です。アルゴリズム設計・複雑なコードのデバッグ・多段階の論理推論はProが適しています。研修先の経験から言うと、「ビジネス文書の80%」はFlashで品質的に問題ないと感じています。残り20%の難しい判断・分析でProを使う設計が最もコスト効率が高いです。
判断基準2: 応答速度の要件
リアルタイムチャットボットや秒単位の応答が必要なシステムはFlashが向いています。ProはFlashより応答が遅い(Highモード使用時は特に)。バッチ処理や非同期処理であればProの精度を活かせます。
判断基準3: コスト上限の設定
月間処理コストの上限を先に決め、逆算でどちらを使うか判断するのも実用的です。
## モデル選択診断プロンプト(自社用にカスタマイズ可能)
以下の条件で、DeepSeek V4-ProとV4-Flashのどちらが適切か教えてください。
タスク内容: [具体的な業務を記載]
月間処理量(概算トークン数): [数値]
応答速度要件: [リアルタイム必須/バッチ処理OK]
精度要件: [高精度必須/ある程度でOK]
データの機密度: [高/中/低]
推奨モデル、月間コスト試算、注意点を教えてください。DeepSeek V4が日本企業に与えるインパクト
DeepSeek V4 Previewの公開は、2つの意味で日本企業に影響します。
まず、AIコモディティ化の加速です。V4-ProがGPT-5.5の8.6分の1のコストでほぼ同等の性能を提供するということは、「AI費用が高くて導入できない」という言い訳が使いづらくなっています。コスト障壁は確実に下がっており、「使うかどうか」から「どう使うか」の競争になっています。
次に、オープンウェイトモデルの現実化です。865GBのV4-Proはまだ一部の大企業・研究機関向けですが、160GBのV4-Flashは中規模企業でも現実的なセルフホスティングの選択肢です。社内データを外に出したくない企業にとって、OpenAI/Anthropicにはなかった「完全オンプレ高性能AI」の選択肢が生まれています。
まとめ:今日から始める3つのアクション
- 今日やること: DeepSeek V4-Flash APIをOpenRouterかDeepSeekの公式APIから試し、非機密の定型業務で現行モデルとコスト・品質を比較する
- 今週中: 自社の「外部AIに送っていいデータ・送ってはいけないデータ」の仕分け基準を確認または作成する
- 今月中: V4-Flashのセルフホスティング可能性(GPU資産の有無、160GBのストレージ確認)をインフラ担当と評価する
あわせて読みたい:
- GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro 3強比較 — フロンティアモデルの用途別選定ガイド
- ChatGPTビジネス活用完全ガイド — AIモデル選定から実務活用まで体系的に理解する
参考・出典
- DeepSeek-V4-Pro — Hugging Face(参照日: 2026-04-24)
- DeepSeek V4 — almost on the frontier, a fraction of the price — Simon Willison(参照日: 2026-04-24)
- DeepSeek V4 Released: Open-Source 1.6T MoE, 1M Context, Apache 2.0 — ofox.ai(参照日: 2026-04-24)
- DeepSeek-V4 Preview Open-Sourced: 1M Context Breakthrough — AI News Detail(参照日: 2026-04-24)
- DeepSeek V4 Released: What’s New in the Latest Model (2026) — SitePoint(参照日: 2026-04-24)
- DeepSeek V4 Release Date (April 2026 Update) — Evolink AI(参照日: 2026-04-24)
著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー約10万人)。100社以上の企業向けAI研修・導入支援を展開。著書『AIエージェント仕事術』(SBクリエイティブ)。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。
ご質問・ご相談は お問い合わせフォーム からお気軽にどうぞ。



