結論: Qwen3.6-Max-Preview(2026年4月20日リリース)は、Alibabaの最新フラッグシップモデル。SWE-Bench Pro等6つのコーディング/エージェントベンチで首位を獲得しつつ、$1.30/M入力という低価格で、Claude Opus 4.7やGPT-5.5を価格でアンダーカット。Alibabaが初めて「クローズドウェイト」を選択した転換点でもあります。
この記事の要点:
- 要点1: SWE-Bench Pro/Terminal-Bench 2.0/QwenClawBench/QwenWebBench/SciCode/SkillsBenchの6つで首位
- 要点2: $1.30/M入力・$7.80/M出力でClaude/GPT/Geminiの最新版を価格で大きく下回る
- 要点3: Qwen史上初の「クローズドウェイト」公開。OpenモデルとClosedの戦略的使い分けへ
対象読者: AIコーディング・エージェント開発の中核モデル選定をしている開発者・PM
読了後にできること: Qwen3.6-Max-Previewを自社開発フローで評価し、コスト/性能で最適モデルを選べる
「Qwen3.6 Maxってどう?Claudeと比べてコスパで勝てる?」
2026年4月20日、AlibabaがQwen3.6-Max-Previewを発表した翌日、開発チームから問い合わせが急増しました。SWE-Bench Pro首位、Terminal-Bench 2.0首位、しかも価格はClaude Opus 4.7($15/M入力)の1/12。「衝撃的」というより「ついに来た」という空気でした。
Qwen3.6-Max-Preview の基本仕様
| 項目 | Qwen3.6-Max-Preview |
|---|---|
| リリース日 | 2026年4月20日 |
| 提供形態 | クローズドウェイト(Qwen初) |
| コンテキスト | 26万トークン |
| 入力料金 | $1.30/M |
| 出力料金 | $7.80/M |
| API互換性 | OpenAI / Anthropic両方対応 |
| 特殊機能 | preserve_thinking(マルチターンエージェント用) |
ベンチマーク:6つで首位獲得
第三者Artificial AnalysisによるIntelligence Index 52は、同価格帯の推論モデル中央値14を大きく上回ります。具体的には:
- SWE-Bench Pro: ソフトウェアエンジニアリング実問題で首位
- Terminal-Bench 2.0: ターミナル操作タスクで首位(Qwen3.6-Plus比+3.8pt)
- QwenClawBench / QwenWebBench: 自社ベンチで安定首位
- SciCode: 科学計算コーディング(+10.8pt)
- SkillsBench: 多技能評価(+9.9pt)
- NL2Repo: 自然言語→リポジトリ生成(+5.0pt)
つまり、コーディング・エージェント特化用途では、Qwen3.6-Plusから一段階上のリーグに上がりました。
料金対比:Claude/GPT/Geminiを大幅アンダーカット
| モデル | 入力 $/M | 出力 $/M | 対 Qwen3.6-Max |
|---|---|---|---|
| Qwen3.6-Max-Preview | $1.30 | $7.80 | 基準 |
| Claude Opus 4.7 | $15 | $75 | 11倍高い |
| GPT-5.5 | $5 | $30 | 3.8倍高い |
| Gemini 3.1 Pro | $3.50 | $10.50 | 2.7倍高い |
クローズドウェイト戦略の意味
これまでQwenシリーズは「中国版Llama」として、ほぼ全モデルをオープンウェイトで公開してきました。3.6-Max-Previewが初のクローズドになった意味は大きく、Alibabaが「最強モデルは商売用、中堅以下はOSS」というOpenAI/Anthropic型ビジネスモデルに移行する転換点を示します。
これは中国系オープンモデル業界全体への影響も大きく、DeepSeek/ZhipuがOpenを継続するなら相対的にOpen側の「最強」枠が空きます。
企業活用シーン3選
1. AIコーディングエージェントの本番モデル
SWE-Bench/Terminal-Bench首位の実力で、Cursor/Claude Code/Roo Codeなどのバックエンドモデルとして使える。料金1/10で同等以上の実装能力。
2. 大量コードレビュー・自動リファクタリング
26万トークンコンテキスト+低価格で、レガシーコードベース全体のレビューや一括リファクタリングを月数千ドルで実現可能。
3. AIエージェントのreasoning step用
preserve_thinking機能でマルチターン処理が安定。Plan→Act→Observe型エージェントの「Think」ステップに最適。
失敗パターン3つ
- ❌「最安だから即移行」→ Preview版なので価格・API仕様変動の可能性。本番は安定版を待つ
- ❌ 機密データを中国系APIに直送 → セキュリティ部門の事前承認必須
- ❌ 自然言語タスクのみで評価 → コーディング特化モデルなので、文章生成は他モデルが優位の場合あり
まとめ:開発者にとって「主モデル候補」レベル
Qwen3.6-Max-Previewは、コーディング/エージェント用途で「セカンドAI」を超えて「主モデル候補」になり得る初の中国系モデル。Preview期間中の挙動を観察しつつ、本格評価を始めるべきタイミングです。
この記事の内容を自社AI開発に活かしたい方へ
弊社ではマルチモデル運用設計の研修・コンサルを提供しています。Qwen3.6-Max-Previewを自社開発フローでどう使うか、無料相談からお気軽にお問い合わせください。
出典
- Qwen3.6-Max-Preview: Smarter, Sharper, Still Evolving(公式)
- Qwen3.6 Max Preview – Intelligence, Performance & Price Analysis
- Qwen3.6-Max-Preview Review: 6 Benchmark #1s, Closed-Weights Shift
- Qwen3.6-Max-Preview: Benchmarks, API & Review (2026)
関連記事:












