スマホメーカーがClaude級AIを作った——その事実が意味すること
3月19日、AI業界に小さな衝撃が走った。
OpenRouterというAPIプラットフォームで数日間首位を独走していた謎のモデル「Hunter Alpha」。多くの開発者がDeepSeek V4だと予想していたが、正体はまったく違った。スマートフォンメーカーのXiaomi(シャオミ)が社内開発したAIモデル「MiMo-V2-Pro」だったのだ。
しかも、これは単発のリリースではない。Xiaomiは同日、フラッグシップLLM「MiMo-V2-Pro」、マルチモーダルモデル「MiMo-V2-Omni」、音声合成モデル「MiMo-V2-TTS」の3モデルを同時に公開した。API料金はClaude Opus 4.6の5分の1。今後3年間で600億元(約8.7億ドル)をAIに投資すると宣言している。
スマホを作っていた会社が、なぜAnthropicやOpenAIと肩を並べるAIを開発できたのか。そしてこの動きは、日本のハードウェアメーカーにとって何を意味するのか。
AIエージェントの基本概念や導入ステップについては、AIエージェント導入完全ガイドで体系的にまとめています。
まず結論: Xiaomiが達成した数字
ファクトだけ並べると、その異常さが際立つ。
- MiMo-V2-Pro: 1兆パラメータ超(アクティブ420億)、SWE-bench Verified 78%(Claude Opus 4.6は80.8%)
- ClawEval(AIエージェント評価): 81ポイント(Claude Opus 4.6は81.5、GPT-5.2は77)
- API料金: 入力$1/100万トークン、出力$3/100万トークン(Claude Sonnet 4.6の約3分の1)
- 匿名テスト期間: OpenRouterで1兆トークン以上の利用実績を記録
- 投資額: 今後3年間で600億元(約87億ドル)のAI投資を表明
スマートフォンの出荷台数で世界3位のXiaomiが、いつの間にかフロンティアAIの開発競争に参入していた。
Xiaomiの課題: 「スマホだけでは生き残れない」という危機感
Xiaomiがなぜここまでの規模でAIに踏み込んだのか。答えは同社の事業戦略にある。
Xiaomiは2024年にEV(電気自動車)事業に参入し、「SU7」を発売した。その後もロボティクス、スマートホームと事業を拡大してきた。同社はこれを「Human × Car × Home(人 × 車 × 家)」エコシステムと呼んでいる。
問題は、このエコシステムを一つに統合する「知能」がなかったことだ。スマートフォン、車、家電をそれぞれ独立したデバイスとして売るだけでは差別化にならない。すべてのデバイスを横断して判断し、行動できるAI——つまりエージェントが必要だった。
だからXiaomiは外部のAPIに依存するのではなく、自社でフルスタックのAIプラットフォームを構築する道を選んだ。テキスト処理だけでなく、映像認識も、音声生成も、エージェント制御も、すべて内製する。その成果が3モデル同時投入だ。
MiMo 3モデルの全容——それぞれが担う役割
MiMo-V2-Pro: エージェント特化のフラッグシップ
MiMo-V2-Proは、Mixture-of-Experts(MoE)アーキテクチャを採用したXiaomiのフラッグシップモデルだ。総パラメータ数は1兆超だが、リクエストごとにアクティブになるのは420億パラメータ。ハイブリッドアテンション機構で100万トークンのコンテキストウィンドウをサポートする。
注目すべきは、このモデルが「エージェントタスク」に最適化されている点だ。ブラウザ操作、コード生成、ファイル操作といった実務的なタスクに強い。
| ベンチマーク | MiMo-V2-Pro | Claude Opus 4.6 | GPT-5.2 |
|---|---|---|---|
| SWE-bench Verified(コーディング) | 78.0% | 80.8% | — |
| ClawEval(エージェント) | 81.0 | 81.5 | 77.0 |
| PinchBench(総合) | 81.0 | 81.5 | — |
| Terminal-Bench 2.0 | 86.7 | — | — |
| Artificial Analysis Index(世界順位) | 7位(中国2位) | — | — |
ClawEvalで81.0ポイントはClaude Opus 4.6の81.5とほぼ同等。「スマホメーカーのAI」という先入観を完全に覆す結果だ。
MiMo-V2-Omni: 見て、聞いて、動くマルチモーダルモデル
MiMo-V2-Omniは、画像・動画・音声のエンコーダを統合したマルチモーダルモデルだ。単に複数のモダリティを理解するだけでなく、ツールコールを実行し、UIを自律的にナビゲートできる。
Xiaomiのデモでは、ドライブレコーダーの映像をリアルタイムで分析し、歩行者や対向車を危険要因としてフラグ付けするシナリオが紹介された。別のデモでは、ブラウザを自ら開き、中国のSNS「小紅書(Xiaohongshu)」で商品レビューを検索し、JD.comで価格比較、チャットで値引き交渉まで行い、購入を完了した。
ベンチマークでは画像理解(MMMU-Pro: 76.8)でClaude Opus 4.6(73.9)を上回り、音声ではGemini 3 Proを超えて10時間以上の連続録音に対応する。ただし、ClawEvalではClaude Opus 4.6(66.3)に大きく及ばない54.8にとどまっており、エージェント性能には課題が残る。
MiMo-V2-TTS: 自然言語で感情を制御する音声合成
3つ目のMiMo-V2-TTSは、1億時間以上の音声データで訓練された音声合成モデルだ。従来のTTSと決定的に違うのは、ドロップダウンから感情を選ぶのではなく、自然言語で声の特徴を指示できる点にある。
「寝起きで少し声がかすれている」と「怒っているが冷静さを保とうとしている」では、まったく異なる音声が生成される。咳払い、ためらい、ため息、笑いといったパラ言語的な音も、後付けではなく出力の一部として自然に生成される。
Xiaomiによると、同一モデルで話し声と歌声の両方をネイティブに処理できる商用TTS APIは、現時点でMiMo-V2-TTSのみだという。
「Hunter Alpha」事件——覆面テストが証明したこと
この話には面白い前日譚がある。
MiMo-V2-Proは正式発表前、APIプラットフォームOpenRouterに「Hunter Alpha」というコードネームで匿名登録されていた。誰が作ったか一切明かされないまま、開発者たちに使われ始めた。
結果は劇的だった。Hunter Alphaは数日間にわたりデイリーランキング首位を独走し、累計1兆トークン以上の利用を記録した。最も多かった用途はコーディングだ。
AI開発者コミュニティではすぐに「これはDeepSeek V4のリークではないか」という憶測が広がった。中国発のMoEモデルで、コーディング性能が異常に高い——DeepSeekしかありえない、と多くの人が考えた。
正体がXiaomiだと判明した時、コミュニティの反応は驚きを超えていた。スマートフォンメーカーがフロンティアモデルを匿名テストし、しかもユーザーの信頼を獲得していた。ブランド名を伏せた状態で実力が証明されたという事実は、どんなマーケティングよりも説得力がある。
価格破壊: なぜXiaomiはClaude Opus 4.6の5分の1で提供できるのか
MiMo-V2-Proの料金設計も衝撃的だ。
| モデル | 入力(100万トークン) | 出力(100万トークン) |
|---|---|---|
| MiMo-V2-Pro | $1 | $3 |
| Claude Sonnet 4.6 | $3 | $15 |
| Claude Opus 4.6 | $5 | $25 |
Claude Opus 4.6と比較すると、入力で5分の1、出力で約8分の1。ローンチ期間中はキャッシュ書き込みコストも無料だ。
この価格設定にはXiaomiの戦略的意図がある。同社はAIモデル単体で利益を出す必要がない。最終的な収益はデバイスの販売とエコシステムへのロックインで回収する。Xiaomiにとって、AIモデルのAPIは開発者を引き込むための「フック」であり、スマートフォン戦略における広告のようなものだ。
正直に言うと、この構造はGoogleがAndroidを無料で配布した戦略と酷似している。AIモデルの価格競争が「タダ同然」になる未来は、もう始まっているのかもしれない。
中国AI市場の競争激化——Xiaomiだけではない
Xiaomiの参入は、中国AI市場の競争がさらに激化していることを示している。
- Zhipu AI: オープンソースモデル「GLM-5」を公開。7,440億パラメータで、Claude Opus 4.5・GPT-5.2レベルのコーディング・エージェント性能を目指す
- Moonshot AI: 「Kimi K2.5」でマルチエージェントのスウォーム(群)処理アプローチを採用
- Alibaba: 「Qwen 3.5」シリーズの拡充を続ける
- DeepSeek: 次期メジャーモデルは規模の拡大により遅延中との報道
2025年のDeepSeekショックに続き、中国のAI企業は「安くて強いモデル」を次々と市場に投入している。Xiaomiの参戦は、この流れをさらに加速させるだろう。
日本企業への影響——ハードウェア×AIの統合は不可避
Xiaomiの動きは、日本のハードウェアメーカーにとって他人事ではない。
第一に、「AIはソフトウェア企業のもの」という前提が崩れた。Xiaomiは外部APIに依存するのではなく、自社のデバイスエコシステムに最適化されたAIを内製した。ソニー、パナソニック、トヨタといった日本のハードウェアメーカーが同じ選択を迫られる日は近い。
第二に、API料金の価格破壊は日本企業にとっても追い風だ。Claude Opus 4.6と同等の性能が5分の1以下の料金で使えるなら、AIエージェント導入のROI計算は根本的に変わる。中小企業でも、本格的なAIエージェントを業務に組み込む現実的な選択肢が生まれた。
第三に、「匿名テスト」のアプローチは日本企業にも示唆がある。ブランド名を伏せて実力で評価を勝ち取る——先入観を排除したユーザーテストの手法は、新規事業やプロダクト開発でも応用できる。
注意すべきリスク——手放しで飛びつくのは危険
とはいえ、筆者がこの件を手放しで賞賛しないのには理由がある。
データ主権の問題。中国企業のAPIに業務データを流す場合、中国のデータ安全法やサイバーセキュリティ法の適用範囲に入る可能性がある。特に個人情報や機密性の高いビジネスデータを扱う場合、法務部門との確認は必須だ。
ベンチマーク vs 実運用のギャップ。ベンチマークスコアが近いからといって、実際の業務で同等の使い勝手が保証されるわけではない。日本語対応の品質、エッジケースでの安定性、長文処理の一貫性など、ベンチマークでは測れない要素は多い。
持続可能性への疑問。87億ドルの投資は巨額だが、Xiaomiの主力事業はあくまでスマートフォンとIoTデバイスだ。AIモデル開発が収益化に時間がかかった場合、投資規模を維持できるかは不透明だ。
エージェント性能のばらつき。MiMo-V2-ProのClawEvalは81.0と優秀だが、マルチモーダル版のMiMo-V2-Omniは54.8にとどまる。「3モデル同時投入」の見出しに惑わされず、モデルごとの得意・不得意を見極める必要がある。
筆者の見立て: 「AIコモディティ化」の本番が始まった
この記事で最も重要なポイントは、個別のベンチマークスコアではない。
スマートフォンメーカーが——しかも純粋なAI研究機関ではなく、ハードウェアとエコシステムを持つ企業が——Claude Opus 4.6と数ポイント差のモデルを、5分の1の価格で提供し始めたという事実だ。
これは「AIモデルのコモディティ化」が最終段階に入ったシグナルだ。企業にとって、モデルの性能差よりも「自社のワークフローにどう組み込むか」「データをどう管理するか」「コストをどう最適化するか」の方が重要な判断軸になる。
100社以上のAI研修・コンサル経験から断言できるのは、AIモデル選定で差がつく時代は終わりつつあるということ。これからは「AIをどう使いこなすか」——つまりコンテキストエンジニアリングとガバナンス設計が、企業の競争力を決める。
まとめ
Xiaomi MiMoの3モデル同時投入は、AI業界の競争地図を書き換える出来事だ。スマートフォンメーカーがフロンティアAI開発に参入し、匿名テストで実力を証明し、破格の価格で市場に投入した。
日本企業が今週確認すべきことは3つ。自社のAI調達戦略にXiaomi MiMoを含む中国モデルの評価を加えること。API料金の急落を前提にROI計算を見直すこと。そしてハードウェア×AI統合の自社戦略を検討し始めること。
あわせて読みたい:
- コンテキストエンジニアリングとは?プロンプトの次に来る企業AIの新常識 — AIモデルの性能差が縮まった今こそ重要な技術
- シャドーAIとは?従業員の8割が無断利用する実態と5つの対策 — 低価格APIの普及で加速するリスクへの対策
参考・出典
- Xiaomi launches three MiMo AI models to power agents, robots, and voice — THE DECODER(参照日: 2026-03-23)
- MiMo-V2-Pro公式ページ — Xiaomi(参照日: 2026-03-23)
- Xiaomi to invest at least $8.7 billion in AI over next three years — Economic Times(参照日: 2026-03-23)
- Xiaomi stuns with new MiMo-V2-Pro LLM nearing GPT-5.2, Opus 4.6 performance — VentureBeat(参照日: 2026-03-23)
- Xiaomi Unveils Three In-House Foundation Models — Pandaily(参照日: 2026-03-23)
著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。X(@SuguruKun_ai)フォロワー10万人超。
100社以上の企業向けAI研修・導入支援。著書累計3万部突破。
SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。
ご質問・ご相談は お問い合わせフォーム からお気軽にどうぞ。


