結論: Anthropicの最強モデル「Mythos」が2026年3月のデータリークで存在が明らかになり、SWE-bench 93.9%・Opusを大幅凌駕するベンチマークを記録。ただし公開停止で企業向けアクセスは限定的。Claude Opus 4.7のリリースも示唆されており、企業のAI導入タイミング戦略に重大な示唆を与えています。
この記事の要点:
- Claude Mythos: SWE-bench 93.9%(Opus 4.6比+13.1pt)、Firefox脆弱性発見で181回成功(Opus比90倍)
- Project Glasswingで40社以上のホワイトリスト企業のみアクセス可能($25/$125 per Mトークン)
- Claude Opus 4.7のリリースがPolymarketで83%確率・5月末までに予測
対象読者: 企業のAI活用基盤の選定・更新時期を検討している経営者・IT部門責任者
読了後にできること: Mythos・Opus 4.7の公開スケジュールを把握し、自社のAI更新計画に組み込める
「すごいAIが出てきたって聞いたけど、うちは今のモデルで十分?買い替え時期はいつ?」
企業向けAI研修でここ数週間、最も多く受けた質問です。2026年3月下旬〜4月にかけて、Anthropicに関する衝撃的な情報が相次いで流出しました。「Mythos」という名のモデルと「Claude Opus 4.7」の存在——これらが企業のAI戦略に何を意味するのかを、100社以上のAI研修・顧問経験から整理します。
なお、この記事はリーク情報と公式発表を明確に区別して記述します。Anthropic公式が確認した情報と、リーク・推測の情報は分けて読んでください。
何が起きたのか — 2段階のリークを整理する
第1波: Claude Codeソースコードリーク(2026年3月末)
Claude Codeのアップデートの不具合で50万行以上のコードが一時的に公開状態になり、その中に「Opus 4.7」「Sonnet 4.8」「Mythos」という文字列が含まれていたことが発覚しました。コードは数分以内にAnthropicが削除しましたが、すでにインターネット上に広まっていました。
第2波: Anthropicコンテンツ管理システムのエラー(2026年3月26日)
Anthropicのコンテンツ管理システムのエラーにより、ブログドラフトや約3,000件の未公開アセットが一時的にアクセス可能な状態になりました。この中にMythosのベンチマーク結果・機能説明が含まれていました。
Fortuneが独占報道し、Anthropicは「Mythosは存在し、早期アクセス顧客がテスト中。公開予定日は未定」と公式確認しました。
Claude Mythos — ベンチマークと現実の姿
公式確認済みのベンチマーク数値
| ベンチマーク | Claude Opus 4.6 | Claude Mythos | 変化 |
|---|---|---|---|
| SWE-bench Verified | 80.8% | 93.9% | +13.1pt |
| SWE-bench Pro | 53.4% | 77.8% | +24.4pt |
| Terminal-Bench 2.0 | 65.4% | 82.0% | +16.6pt |
| Firefox脆弱性発見成功回数 | 2回/数百回 | 181回/数百回 | 約90倍 |
特にサイバーセキュリティ能力の伸びが際立っています。テスト中にFirefox・Chrome・主要OSの全てでゼロデイ脆弱性を「発見して悪用するJavaScriptシェルエクスプロイト」の作成に成功したと報告されています。
なぜ公開されないのか
Anthropicは「Mythosの能力は前例のないサイバーセキュリティリスクをもたらす」として公開を停止しました。代わりに「Project Glasswing(プロジェクト・グラスウィング)」という枠組みで、40社以上のホワイトリスト企業にのみアクセスを提供しています。
「Mythosは現時点で公開しない。ただし、このモデルで学んだことを次世代Opusに組み込み、適切な安全策とともに提供する予定だ」
— Anthropic公式声明(2026年4月)
つまり、Mythos自体が直接一般企業に来るわけではありません。次のOpusモデル(おそらくOpus 4.7)に、Mythosの能力が安全フィルター付きで実装されるシナリオが有力です。
Project Glasswingの詳細
Project Glasswingでアクセスできる企業は、セキュリティ審査を通過した「ホワイトリスト」に登録されたテック企業・セキュリティ研究機関に限定されています。価格は$25/Mトークン(入力)・$125/Mトークン(出力)とClaude Opus 4.6の約3〜5倍の水準です。一般中小企業が利用できる状態ではありません。
Claude Opus 4.7 — 何がわかっているか
リークから判明した情報
ソースコードリークには「opus-4.7」の文字列に加え、以下の情報が含まれていたと複数のメディアが報告しています(リーク情報のため公式未確認)。
- 「フルスタックアプリケーション作成プラットフォーム」との連携を示すコード
- Microsoft Word統合に関する記述
- SWE-bench Verifiedスコアとして93.9%という数値(MythosとOpus 4.7で共有か未確認)
Polymarketの予測市場
予測市場Polymarketでは「Claude 4.7が2026年5月31日までに公開」に83%の確率がついています(2026年4月14日時点)。これはAnthropicのリリースペース(Opus 4.5: 2025年11月、Opus 4.6: 2026年2月)と一致します。
| モデル | リリース | 間隔 |
|---|---|---|
| Claude Opus 4.5 | 2025年11月 | — |
| Claude Opus 4.6 | 2026年2月 | 約3ヶ月 |
| Claude Opus 4.7(予測) | 2026年5月頃 | 約3ヶ月 |
賛否両論 — Mythos情報をどう評価すべきか
楽観論: AIの能力が本当に「ステップチェンジ」した証拠
SWE-bench 93.9%は実用的な意味で重要です。コード修正タスクの9割以上をAIが自律的に解決できることを意味し、ソフトウェア開発の生産性革命が加速します。Anthropicの「step change in capabilities」という表現は過大評価ではないかもしれません。
慎重論: リーク情報の信頼性と「能力≠実用性」の問題
正直に言えば、リーク情報には不確実性があります。
- ベンチマーク数値は「テスト環境」のもの。実際のビジネスタスクで同等の精度が出るかは別問題
- サイバーセキュリティ能力の誇張がマーケティング目的で含まれている可能性
- 公開停止の理由が「本当にリスクが高いから」か「段階的リリース戦略から」か不明
地政学・競合文脈
Frontier Model Forumの協調(記事1参照)と合わせて見ると、Anthropicが「軍拡的な能力開発」と「安全性重視」の両立を迫られている構図が見えます。Mythosを公開しない判断は「安全性への責任感」であると同時に、「競合との差別化要素を温存する」戦略でもあるかもしれません。
日本企業への影響と導入タイミング戦略
影響1: 今年中に「一般企業向けMythos相当の能力」が来る可能性
AnthropicがMythosの能力をOpus 4.7に組み込む予定なら、2026年5〜6月頃に「Opus 4.7」として一般企業もアクセスできる形で提供される可能性があります。ただしサイバーセキュリティ面の強力な機能は制限される見込みです。
影響2: Anthropic API利用企業はモデル更新計画を立てる
現在Claude Opus 4.6を使っている企業は、Opus 4.7リリース後のマイグレーション計画を今から立てることを推奨します。特にコーディング・複雑な推論タスクで、大幅な精度向上が期待できます。
影響3: AI調達・予算サイクルとの調整
100社以上の顧問先で共通する課題が「AIツールの更新が予算サイクルに追いつかない」問題です。年1回の予算審議でAIツールを固定すると、3〜6ヶ月に1回来るモデル更新に対応できません。「AIモデル評価・更新」を四半期ごとの定期タスクとして組み込むことを強くお勧めします。
企業がとるべきアクション — 今のタイミングでやること
アクション1: 現在のClaude Opus 4.6の使い方を「記録」しておく
Opus 4.7リリース時の評価を効率的にするため、今使っているタスク・プロンプト・精度指標を記録しておきましょう。以下のプロンプトを活用してください。
【AI利用実績記録プロンプト】
以下のフォーマットで、今月のAI活用実績をまとめてください:
1. 主な使用用途(タスク名)
2. 1週間あたりの使用頻度
3. 主観的な精度評価(1-5点)
4. 特に困っていること・改善したいこと
5. もし精度が2倍になったら何ができるか
回答は箇条書きで、各項目3行以内にまとめてください。
不足している情報があれば、最初に質問してから作業を開始してください。
アクション2: Opus 4.7リリース時の評価プロセスを設計する
新モデルが出た時に「とりあえず試してみる」だけでは導入判断ができません。以下の評価プロセスを今から設計しておくと、リリース直後に素早く判断できます。
- 評価タスク選定: 自社で最も使う用途を3〜5つ選ぶ
- ベースライン記録: 現行モデルでの精度・時間を測定(今すぐできる)
- 比較評価: 新モデルリリース後に同じタスクで比較
- 判断基準: 「精度XX%以上改善 or コストXX%以内なら移行」を決めておく
アクション3: サイバーセキュリティ用途はProject Glasswingを問い合わせる
ソフトウェア開発・セキュリティ診断・コード監査を主な用途としている企業は、Project Glasswingのホワイトリスト申請を検討してください(anthropic.com/glasswing)。ただし審査が厳しく、中小企業での採択は現時点では困難と見られます。
アクション4: 「待つ」も立派な戦略である
正直に言えば、Mythosが来るから今のモデル導入を止める、という判断は多くの企業では合理的ではありません。「今のClaude Opus 4.6で十分な精度が出ているなら、Opus 4.7が出た後に評価する」——これが最もコストパフォーマンスの高い戦略です。
AIは3〜6ヶ月で大幅に進化します。「次のモデルが来るから待つ」を続けると永遠に導入できません。今の課題にとって「十分か」を基準にしてください。
まとめ
Claude Mythosは「AIの能力がまた一段階上がった」ことを示す証拠です。SWE-bench 93.9%・Firefox脆弱性181回成功という数字は、コーディング・セキュリティ領域での革命的な変化を示しています。ただし一般企業が直接使えるのはおそらくOpus 4.7として、2026年5〜6月頃になると予測されます。
今企業がやるべきことは「Mythosを待つ」ではなく、「今のモデルを使い倒しながら、次のモデルの評価プロセスを設計する」ことです。
AIエージェントや自律的なコーディングツールの活用については、AIエージェント導入完全ガイドで体系的にまとめています。
あわせて読みたい:
- Grok 5 vs Claude Mythosパラメータ戦争の全貌 — AIスケール競争を徹底比較
- ChatGPT 企業導入完全ガイド — Business/Enterpriseプラン比較
参考・出典
- Exclusive: Anthropic ‘Mythos’ AI model representing ‘step change’ in power revealed in data leak — Fortune(参照日: 2026-04-14)
- Anthropic Releases Claude Mythos Preview with Cybersecurity Capabilities but Withholds Public Access — InfoQ(参照日: 2026-04-14)
- Anthropic’s Claude Mythos Hits 93.9% SWE-Bench but Won’t Be Released — AI Unfiltered(参照日: 2026-04-14)
- Anthropic debuts Project Glasswing — SiliconANGLE(参照日: 2026-04-14)
- Claude Mythos Preview — Anthropic red team blog(参照日: 2026-04-14)
- Why Anthropic’s new model has cybersecurity experts rattled — Platformer(参照日: 2026-04-14)
著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー約10万人)。100社以上の企業向けAI研修・導入支援を展開。著書『AIエージェント仕事術』(SBクリエイティブ)。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。
ご質問・ご相談はお問い合わせフォームからお気軽にどうぞ。




