コンテンツへスキップ

media AI活用の最前線

20

【2026年4月速報】Qwen3.6-Max完全解説|SWE-Bench首位

【2026年4月速報】Qwen3.6-Max完全解説|SWE-Bench首位

結論: Qwen3.6-Max-Preview(2026年4月20日リリース)は、Alibabaの最新フラッグシップモデル。SWE-Bench Pro等6つのコーディング/エージェントベンチで首位を獲得しつつ、$1.30/M入力という低価格で、Claude Opus 4.7やGPT-5.5を価格でアンダーカット。Alibabaが初めて「クローズドウェイト」を選択した転換点でもあります。

この記事の要点:

  • 要点1: SWE-Bench Pro/Terminal-Bench 2.0/QwenClawBench/QwenWebBench/SciCode/SkillsBenchの6つで首位
  • 要点2: $1.30/M入力・$7.80/M出力でClaude/GPT/Geminiの最新版を価格で大きく下回る
  • 要点3: Qwen史上初の「クローズドウェイト」公開。OpenモデルとClosedの戦略的使い分けへ

対象読者: AIコーディング・エージェント開発の中核モデル選定をしている開発者・PM

読了後にできること: Qwen3.6-Max-Previewを自社開発フローで評価し、コスト/性能で最適モデルを選べる

「Qwen3.6 Maxってどう?Claudeと比べてコスパで勝てる?」

2026年4月20日、AlibabaがQwen3.6-Max-Previewを発表した翌日、開発チームから問い合わせが急増しました。SWE-Bench Pro首位、Terminal-Bench 2.0首位、しかも価格はClaude Opus 4.7($15/M入力)の1/12。「衝撃的」というより「ついに来た」という空気でした。

Qwen3.6-Max-Preview の基本仕様

項目Qwen3.6-Max-Preview
リリース日2026年4月20日
提供形態クローズドウェイト(Qwen初)
コンテキスト26万トークン
入力料金$1.30/M
出力料金$7.80/M
API互換性OpenAI / Anthropic両方対応
特殊機能preserve_thinking(マルチターンエージェント用)

ベンチマーク:6つで首位獲得

第三者Artificial AnalysisによるIntelligence Index 52は、同価格帯の推論モデル中央値14を大きく上回ります。具体的には:

  • SWE-Bench Pro: ソフトウェアエンジニアリング実問題で首位
  • Terminal-Bench 2.0: ターミナル操作タスクで首位(Qwen3.6-Plus比+3.8pt)
  • QwenClawBench / QwenWebBench: 自社ベンチで安定首位
  • SciCode: 科学計算コーディング(+10.8pt)
  • SkillsBench: 多技能評価(+9.9pt)
  • NL2Repo: 自然言語→リポジトリ生成(+5.0pt)

つまり、コーディング・エージェント特化用途では、Qwen3.6-Plusから一段階上のリーグに上がりました。

AI活用、何から始めればいい?

100社以上の研修実績をもとに、30分の無料相談で貴社の課題を整理します。

無料相談はこちら 資料ダウンロード(無料)

料金対比:Claude/GPT/Geminiを大幅アンダーカット

モデル入力 $/M出力 $/M対 Qwen3.6-Max
Qwen3.6-Max-Preview$1.30$7.80基準
Claude Opus 4.7$15$7511倍高い
GPT-5.5$5$303.8倍高い
Gemini 3.1 Pro$3.50$10.502.7倍高い

クローズドウェイト戦略の意味

これまでQwenシリーズは「中国版Llama」として、ほぼ全モデルをオープンウェイトで公開してきました。3.6-Max-Previewが初のクローズドになった意味は大きく、Alibabaが「最強モデルは商売用、中堅以下はOSS」というOpenAI/Anthropic型ビジネスモデルに移行する転換点を示します。

これは中国系オープンモデル業界全体への影響も大きく、DeepSeek/ZhipuがOpenを継続するなら相対的にOpen側の「最強」枠が空きます。

企業活用シーン3選

1. AIコーディングエージェントの本番モデル

SWE-Bench/Terminal-Bench首位の実力で、Cursor/Claude Code/Roo Codeなどのバックエンドモデルとして使える。料金1/10で同等以上の実装能力。

2. 大量コードレビュー・自動リファクタリング

26万トークンコンテキスト+低価格で、レガシーコードベース全体のレビューや一括リファクタリングを月数千ドルで実現可能。

3. AIエージェントのreasoning step用

preserve_thinking機能でマルチターン処理が安定。Plan→Act→Observe型エージェントの「Think」ステップに最適。

失敗パターン3つ

  • ❌「最安だから即移行」→ Preview版なので価格・API仕様変動の可能性。本番は安定版を待つ
  • ❌ 機密データを中国系APIに直送 → セキュリティ部門の事前承認必須
  • ❌ 自然言語タスクのみで評価 → コーディング特化モデルなので、文章生成は他モデルが優位の場合あり

まとめ:開発者にとって「主モデル候補」レベル

Qwen3.6-Max-Previewは、コーディング/エージェント用途で「セカンドAI」を超えて「主モデル候補」になり得る初の中国系モデル。Preview期間中の挙動を観察しつつ、本格評価を始めるべきタイミングです。

この記事の内容を自社AI開発に活かしたい方へ

弊社ではマルチモデル運用設計の研修・コンサルを提供しています。Qwen3.6-Max-Previewを自社開発フローでどう使うか、無料相談からお気軽にお問い合わせください。

出典

関連記事:

佐藤傑
この記事を書いた人 佐藤傑

株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー10万人超)。100社以上の企業向けAI研修・導入支援を展開。著書累計3万部突破。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

この記事をシェア

Claude Codeを本格的に使いこなしたい方へ

週1回・1時間のマンツーマン指導で、3ヶ月後にはClaude Codeで自走できる実力が身につきます。
現役エンジニアが貴方の業務に合わせてカリキュラムをカスタマイズ。

✓ 1対1のマンツーマン ✓ 全12回・3ヶ月 ✓ 実務ベースの指導
Claude Code 個別指導の詳細を見る まずは無料相談

contact お問い合わせ

生成AI研修や開発のご依頼、お見積りなど、
お気軽にご相談ください。

Claude Code 個別指導(1対1・12セッション)をご希望の方はこちらから別途お申し込みください

Claude Code 個別指導 無料相談