生成AI最新ニュース 2026.04.23

【2026年最新】MiniMax M2.7｜自己進化型エージェントがOSS公開

結論: MiniMax M2.7は、人間の介入なしに自らのコードを書き換えて進化する「自己進化型AIエージェントモデル」として2026年4月にオープンソース公開されました。

この記事の要点:

SWE-Pro 56.22%（GPT-5.3-Codex同等）・Terminal Bench 2 57.0%を達成し、コーディングエージェントとしてオープンソース最高水準
短期記憶・自己フィードバック・自己最適化の3コンポーネントで構成された自己進化ハーネスを搭載
Claude Opus 4.6クラスの性能を入力1/50・出力1/60のコストで提供。日本企業のオープンモデル活用戦略を解説

対象読者: AIエージェント基盤の構築を検討しているエンジニア・技術責任者・CTO
読了後にできること: MiniMax M2.7の自己進化アーキテクチャを理解し、自社のコスト最適化戦略に組み込む判断ができる

「AIが自分自身のコードを書き直して、性能を上げていく」

そんなSF的なシナリオが現実になりました。2026年4月12日、中国AIスタートアップMiniMax（稀宇科技）がMiniMax M2.7をオープンソース公開。驚くべきは性能だけではなく、「このモデル自身がトレーニング中に100回以上のスキャフォールド最適化を自律実行し、人間の介入なしに内部評価で30%の性能向上を達成した」という事実です。

私は企業向けAI研修の中で、特にエンジニアリングチームへの研修でよく聞かれます。「Claude CodeとDevinとCursor、どれを社内エージェントに使えばいいですか？」と。この問いへの答えが、今回の発表でまた複雑になりました。オープンソースで、しかもコスト1/50のClaudeクラスが登場したからです。

AIエージェントの基本概念についてはAIエージェント完全ガイドをあわせてご覧ください。この記事では、M2.7の技術的な核心と、日本企業がどう活用するかに絞って解説します。

MiniMax M2.7とは — 「自分自身を改良したモデル」の正体

MiniMax M2.7は、MiniMaxのM2シリーズ最新作です。Mixture-of-Experts（MoE）アーキテクチャを採用しており、以下のスペックを持ちます。

スペック	値
総パラメータ数	230B
推論時アクティブパラメータ	10B（総数の約4%）
エキスパート数	256
コンテキスト長	200K トークン
公開場所	Hugging Face（MiniMaxAI/MiniMax-M2.7）

MoEアーキテクチャの特性上、230Bという巨大なパラメータ数を持ちながら、推論時に動かすのは10Bだけ。これが「Claude Opus 4.6クラスの性能をコスト1/50で提供できる」理由です。

3コンポーネントの自己進化ハーネス — どう「自分を改良」するのか

MiniMax M2.7の最大の特徴は、自らの動作環境（エージェントハーネス）を自動改善する仕組みを内部開発に取り入れた最初のバージョンという点です。

この自己進化を実現するのが、3つのコンポーネントで構成されたハーネスです。

コンポーネント1: 短期記憶（Short-Term Memory）

各イテレーションラウンド後に、エージェントが「自分が今回どう動いたか」をMarkdownファイルとして記録します。次のラウンドでこの記憶を参照し、同じ間違いを繰り返さないようにします。人間が「振り返りメモ」を書いて次の仕事に活かすのと同じ発想です。

コンポーネント2: 自己フィードバック（Self-Feedback）

現在の結果に対してモデル自身が自己批評を行います。「この実装のどこが不十分か」「なぜこのテストが落ちたか」を自分で分析し、改善方向を文章化します。

コンポーネント3: 自己最適化（Self-Optimization）

自己フィードバックをもとに、次のラウンドに向けた具体的な最適化方向を生成します。これが100回以上繰り返されることで、スキャフォールド全体が自動改善されていきました。

実際のトレーニング中、M2.7はこの3コンポーネントを使って自律的に100回以上の最適化を実行し、内部評価で30%の性能向上を達成しました（測定期間: トレーニングサイクル全体、測定方法: MiniMax内部ベンチマーク）。

AI活用、何から始めればいい？

100社以上の研修実績をもとに、30分の無料相談で貴社の課題を整理します。

無料相談はこちら →資料ダウンロード（無料）

ベンチマーク結果 — Devin・Claude Agentとの比較

コーディングエージェントベンチマーク

ベンチマーク	MiniMax M2.7	GPT-5.3-Codex	Claude Agent
SWE-Pro（複数言語）	56.22%	56.0%（同等）	非公開
Terminal Bench 2	57.0%	非公開	非公開
NL2Repo	39.8%	非公開	非公開

MLE Bench Lite（機械学習競技）— 競合との比較

OpenAIのMLE Bench Liteで、22のMLコンペティションをA30 GPU1枚ずつで実行した結果です。

モデル	メダル率（平均3回）	ベストラン
Claude Opus 4.6	75.7%	—
GPT-5.4	71.2%	—
MiniMax M2.7	66.6%	金9・銀5・銅1
Gemini 3.1	66.6%	—

メダル率66.6%は、Opus 4.6・GPT-5.4に次ぐ第3位タイ。「オープンソースのフリーのモデル」がこの水準を達成したことが業界を驚かせました。

コスト比較 — Claude Opus 4.6クラスが1/50で使える現実

モデル	入力コスト（1Mトークン）	出力コスト（1Mトークン）	オープンソース
Claude Opus 4.6	$15	$75	なし
GPT-5.4	$10	$30	なし
MiniMax M2.7（API）	$0.30	$1.30	あり（モデル重み公開）

大量のAPI呼び出しが発生するエージェント基盤では、この差が月次コストに劇的に効いてきます。

日本企業が今すぐ検討すべき活用シナリオ

シナリオ1: 社内コーディングエージェント基盤

GitHub Copilotや有料のDevin代替として、M2.7をオンプレミスまたはプライベートクラウドで運用するシナリオ。SWE-Pro 56.22%という実績は、実務的なコード生成・修正で十分な水準です。金融・医療など情報管理が厳しい業種で特に有効です。

シナリオ2: 高頻度呼び出しの自動化パイプライン

私が顧問先の製造業で構築した事例として、「品質検査レポートの自動生成」があります。月間数万件のAPI呼び出しが発生するこうしたパイプラインでは、API単価の差が直接コストに響きます。Claude Opus 4.6クラスで月50万円かかっていたところ、M2.7に移行して月1万円程度に削減できた、というシナリオが十分に現実的です。

シナリオ3: 研究開発部門のAIエージェント

機械学習研究部門での活用。MLE Bench Liteの結果が示すように、MLコンペティション水準の研究タスクに対応できます。研究者が仮説を立て、コード実装はM2.7に任せるという分業が可能になります。

【要注意】オープンモデル活用の落とし穴

落とし穴1: 「オープンソースだから無料」の誤解

❌ モデル重みが無料なら、運用コストもゼロだと思ってしまう
⭕ 230Bモデルを動かすには相応のGPUインフラが必要。A100/H100複数枚が前提

なぜ重要か: API経由での利用（MiniMax公式APIやサードパーティAPI）と、自社でホストする場合のコスト構造は全く異なります。「オープンソース活用」にはインフラコストの試算が不可欠です。

落とし穴2: 「自己進化 = 無限に賢くなる」の過剰期待

❌ M2.7を動かし続けていれば、自動でどんどん賢くなると思ってしまう
⭕ 自己進化はトレーニングプロセス内での最適化。推論時に自動進化するわけではない

なぜ重要か: 「自己進化型」という表現は、トレーニング中にモデル自身がハーネスを改善したという意味です。推論時（実際に使うとき）に自動学習・改善されるわけではありません。

落とし穴3: ライセンスを確認せずに商用利用する

❌ オープンソースだから商用利用OKと判断する
⭕ MiniMax M2.7のライセンス条件（MiniMax Model License）を必ず確認する

なぜ重要か: モデルによってはサービスへの組み込みや商用APIサービス化に制約がある場合があります。法務確認は必須です。

落とし穴4: セキュリティ審査なしで機密データを入力する

❌ 性能が良いからと、社内機密情報をそのまま入力する
⭕ 自社ホスト環境を構築するか、データ管理ポリシーを整備した上で利用する

なぜ重要か: API経由では入力データが外部サーバーを経由します。金融・医療・官公庁では特に注意が必要です。

まとめ：今日から始める3つのアクション

今日やること: MiniMax M2.7の公式ページ（minimax.io）とHugging Faceのモデルカードを確認し、ライセンス条件を把握する
今週中: 自社の月間API呼び出し数を把握し、Claude/GPT-5との費用比較試算を行う
今月中: 機密性の低い業務（社内ドキュメント整形・コードレビューサポート等）でM2.7 APIの試験利用を開始する

AIエージェント戦略の全体像についてはAI導入戦略ガイドでまとめています。オープンモデルの選定はその中の重要な1ピースです。

参考・出典

MiniMax M2.7: Early Echoes of Self-Evolution — MiniMax公式（参照日: 2026-04-19）
MiniMax Just Open Sourced MiniMax M2.7 — MarkTechPost（参照日: 2026-04-19）
MiniMax M2.7 Advances Scalable Agentic Workflows on NVIDIA Platforms — NVIDIA Technical Blog（参照日: 2026-04-19）
MiniMaxAI/MiniMax-M2.7 on Hugging Face（参照日: 2026-04-19）
MiniMax M2.7: The Self-Evolving AI Model That Rivals Claude and GPT — WaveSpeedAI（参照日: 2026-04-19）

著者: 佐藤傑（さとう・すぐる）
株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X（旧Twitter）で活用法を発信（@SuguruKun_ai、フォロワー約10万人）。100社以上の企業向けAI研修・導入支援を展開。著書『AIエージェント仕事術』（SBクリエイティブ）。SoftBank IT連載7回執筆（NewsPicks最大1,125ピックス）。

ご質問・ご相談はお問い合わせフォームからお気軽にどうぞ。

この記事を書いた人佐藤傑

株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X（旧Twitter）で活用法を発信（@SuguruKun_ai、フォロワー10万人超）。100社以上の企業向けAI研修・導入支援を展開。著書累計3万部突破。SoftBank IT連載7回執筆（NewsPicks最大1,125ピックス）。

@SuguruKun_ai SoftBank IT連載詳しいプロフィール

media AI活用の最前線

【2026年最新】MiniMax M2.7｜自己進化型エージェントがOSS公開

MiniMax M2.7とは — 「自分自身を改良したモデル」の正体