コンテンツへスキップ

media AI活用の最前線

AIニュース速報

Qwen 3.6-Max主要モデル比較|SWE首位・料金30選

Qwen 3.6-Max主要モデル比較|SWE首位・料金30選

結論: Qwen3.6-Max-Preview(2026年4月20日リリース)は、SWE-Bench Pro首位・Terminal-Bench 2.0首位など6つのコーディング/エージェントベンチで首位を獲得しながら、入力$1.04/M・出力$6.24/Mという低価格を実現したAlibabaの最新フラッグシップ。Claude Opus 4.7(SWE-Bench Verified 87.6%)との競合で「コーディングエージェントのメインモデル候補」として急浮上しています。

この記事の要点:

  • 要点1: SWE-Bench Pro・Terminal-Bench 2.0など6ベンチ首位。SWE-Bench Verified(推定82〜85%)でもClaude Opus 4.7の87.6%に肉薄
  • 要点2: 入力$1.04/M・出力$6.24/Mは、Claude Opus 4.7(入力$5〜$15/M)の数分の1。コスト効率で選択肢に入る初の中国系モデル
  • 要点3: Qwen初の「クローズドウェイト」公開。APIが使えないセルフホスト派には、SWE-Bench Verified 73.4%のオープンウェイト版Qwen3.6-35B-A3Bが代替選択肢

対象読者: AIコーディングエージェントのモデル選定をしている開発者・エンジニアリングマネージャー・CTO

読了後にできること: Qwen3.6-MaxとClaude/GPT/DeepSeekを用途別に使い分けるモデル選定基準を持てる

「Qwen3.6 Maxってどう?コーディングエージェントのメインモデルとして使えるのかな?」

2026年4月下旬、私が運営するAIコーディングのSlackコミュニティで、この質問が一晩で30件以上集まりました。4月20日にAlibaba がQwen3.6-Max-Previewを発表した直後のことです。SWE-Bench Pro首位、Terminal-Bench 2.0首位、しかも価格はClaude Opus 4.7(入力$15/M)と比較して数分の1。「衝撃」というより「ついに来た」という空気でした。

私は100社以上の企業向けAI研修・導入支援を行ってきましたが、2026年春は「どの基盤モデルを選ぶか」の相談が特に増えています。Claude CodeやCursor、Roo Codeなどのコーディングエージェントが普及し、バックエンドモデルのコストが直接開発費に直結するようになったためです。そのタイミングでQwen3.6-Maxが登場したことで、「これまでClaude一択だったモデル選定を再考する」という動きが明らかに出てきています。

この記事では、Qwen3.6-Maxの仕様・ベンチマーク・料金を完全解説し、業務活用プロンプト30選を収録します。「SWE-Bench首位の根拠は?」「Claude/DeepSeekとどう使い分けるのか?」「日本企業がAPI利用する際のセキュリティ上の注意点は?」——これらを一気に解決します。5分でスキャンできる結論早見表から、実務ですぐ使えるプロンプトまで、ぜひ最後まで読んでみてください。

結論早見表:Qwen3.6-Maxは「何に使えるか」

長い記事を読む前に、まず「使えるかどうか」の判断材料を先に出します。

用途Qwen3.6-MaxClaude Opus 4.7推奨
SWE-Bench型コーディング(バグ修正・PR自動生成)◎ Pro首位◎ Verified 87.6%コスト重視→Qwen
精度重視→Claude
ターミナルエージェント(CLI操作・スクリプト生成)◎ Terminal-Bench首位○ 69.4%Qwen
大量コードレビュー(長いコンテキスト)◎ 262Kトークン◎ 1Mトークンファイル数が多い→Claude
コスト重視→Qwen
マルチターンエージェント(Plan→Act→Observe)◎ preserve_thinking対応Qwen(コスト面で有利)
自然言語文章生成・ライティングClaude
科学計算・数学的推論(SciCode)◎ SciCode首位Qwen
機密データを含む社内コーディング△ セキュリティ審査必要○ 米国所在Claude(or Qwenオープンウェイト版をオンプレ)
セルフホスト(社内サーバー)❌ クローズドウェイト❌ クローズドウェイトQwen3.6-35B-A3B(オープンウェイト版)

AIコーディングエージェントの基本概念や選定ステップについては、AIエージェント導入完全ガイドで体系的にまとめています。あわせて参照してください。

Qwen3.6-Maxとは何か:シリーズ全体から理解する

Qwen(通称クウェン)は、中国のAlibaba Groupが開発・提供するLLMシリーズです。2023年から継続的に公開され、Qwen3/3.5/3.6と急速に進化してきました。日本ではDeepSeekほど話題になっていないかもしれませんが、コーディング特化ベンチマークでの実力はDeepSeekと並んで「中国系モデルの双璧」と評される水準です。

Qwen3.6シリーズの3つのモデル

モデルパラメータリリースウェイト公開入力料金主な用途
Qwen3.6-35B-A3B総35B / アクティブ3B(MoE)2026年4月初旬○ Apache 2.0セルフホストオンプレミス・機密データ
Qwen3.6-Plus非公開(MoE推定)2026年4月2日❌ クローズド$0.28/M入力本番RAG・ドキュメント処理
Qwen3.6-Max-Preview非公開(大規模MoE推定)2026年4月20日❌ クローズド$1.04/M入力コーディングエージェント・フロンティア推論

注目点は、Qwen3.6-Maxがシリーズ初の完全クローズドウェイトであること。これまでQwenはほぼ全モデルをApache 2.0でオープン公開し、「中国版Llama」として普及してきました。Max-Previewで初めて重みを非公開にしたことで、AlibabがOpenAI/Anthropic型の「最強モデルは商用API専用、中堅以下はOSS」というビジネスモデルに移行したことを示しています。

アーキテクチャの推定と公開情報

Alibabaはパラメータ総数・アクティブパラメータ数・MoE構成の詳細を非公開にしています(参照: Digital Applied「Parameter count undisclosed」2026年4月)。ただし、OpenRouterの情報とシリーズ構成から以下が推定されています:

  • Mixture-of-Experts(MoE)スパース構造(確認済み)
  • コンテキスト長: 262,144トークン(262K)(OpenRouter確認)
  • preserve_thinking機能搭載(マルチターンエージェント向けの思考プロセス保持機能)
  • OpenAI API / Anthropic API 両互換

なぜパラメータを非公開にするのか
コーディングエージェント市場では、モデルの「大きさ」よりも「ベンチマーク性能」と「コスト効率」で競合比較されるようになっています。パラメータ数を開示しないことで、「どれだけ大きなGPUを使っているか」という競合への情報提供を避ける戦略と見られます。

SWE-Bench首位の根拠:ベンチマーク詳細解説

「SWE-Bench首位」という主張を正確に理解するには、どの種類のSWE-Benchで首位なのかを明確にする必要があります。ここは研修でも「混同されやすいポイント」として私がよく補足している箇所です。

SWE-Bench系ベンチマークの違い

ベンチマーク名測定内容独立性Qwen3.6-MaxClaude Opus 4.7
SWE-Bench VerifiedGitHub実際のバグ修正タスク(人間が品質確認済み)◎ 第三者独立推定82〜85%87.6%(リーダーボード最上位)
SWE-Bench Proより高難度の実コード変更タスク△ 評価機関が限定的首位(Alibaba公表・第三者追認)約54%(参考値)
Terminal-Bench 2.0ターミナル操作エージェントタスク首位(65.40)69.4%(参考値あり)
QwenClawBench / QwenWebBenchAlibaba自社開発ベンチ❌ 自社ベンチ首位
SciCode科学計算コーディング首位(Qwen3.6-Plus比+10.8pt)
SkillsBench多技能評価首位(+9.9pt)

ポイント: Qwen3.6-Maxが首位を獲っているのは、SWE-Bench Verified(最も権威ある独立ベンチ)ではなく、主にSWE-Bench Proや自社ベンチです。SWE-Bench Verifiedでの推定スコア(82〜85%)はClaude Opus 4.7(87.6%)にまだ及ばない、というのが正確な状況です。

ただし、SWE-Bench Proはより高難度の実務的タスクに特化したベンチであり、実際のソフトウェアエンジニアリング業務に近い評価という意見もあります。「どちらが実務に近いか」は議論が続いています。

第三者実テスト結果(Towards AI, 2026年4月)

事例区分: 公開事例
Towards AIに掲載されたエンジニア Chew Loong Nian氏による独立テスト(2026年4月)では、20の実コーディングタスクでQwen3.6-Max-Preview vs Claude Opus 4.7 vs GPT-5.4を比較。結果は「Claude Opus 4.7が97/100でトップ、Qwen3.6-Maxはベンチマーク首位だった項目で意外な弱点を示した」と報告。また、実ベンチ独自のRails chatアプリケーション構築テストでは、Qwen3.6-Plusが71/100(Tier B)に留まり、Claude/GPTの96〜97/100(Tier A)に差をつけられた。

これは「ベンチマーク首位 ≠ 全ての実タスクで最高」という典型的な注意点です。特定の高難度コーディングベンチでは確かにリードしているものの、幅広い実務タスクでの安定性はClaude Opus 4.7に軍配が上がるというのが現状の評価です。

Artificial Analysis Intelligence Indexでの評価

独立評価機関 Artificial Analysisは、Qwen3.6-MaxのIntelligence Indexスコアを52と評定。これは「同価格帯の推論モデル中央値14を大きく上回る」数値であり、コストパフォーマンスの高さを示しています。

料金の全体像:Qwen3.6-Max vs 競合モデル

「価格で劇的にアンダーカットする」という触れ込みですが、実際の数値で確認しましょう。

API料金比較(2026年5月時点)

モデル入力 $/Mトークン出力 $/MトークンコンテキストQwen-Maxとの比較
Qwen3.6-Max-Preview$1.04$6.24262K基準
Qwen3.6-Plus$0.28$1.661MMax比 入力73%安
DeepSeek V4 Pro$0.58$3.48128K入力44%安
GPT-5.5$5.00$30.001M入力4.8倍高
Claude Opus 4.7$5.00〜$15.00$25.00〜$75.001M入力5〜14倍高
Qwen3.6-35B-A3B(セルフホスト)GPU代のみGPU代のみ128KAPI料金不要

料金の注意点: Qwen3.6-Max-Previewは「Preview版」のため、価格は変動する可能性があります。Tokenmix Blogの分析では、正式リリース後は入力$0.50/M・出力$3.00/M程度まで下がる予測もあります(Q3 2026目途)。本番導入の計画を立てる際は、最新価格を必ずAlibaba Cloud公式またはOpenRouterで確認してください。

コスト計算:月100万回のAPI呼び出しシミュレーション

想定シナリオ
月100万回のAPIリクエスト、平均入力1,000トークン・出力500トークン/リクエスト

モデル月間コスト試算
Qwen3.6-Max-Preview$1,040(入力)+ $3,120(出力)= 約$4,160
Claude Opus 4.7$5,000(入力)+ $12,500(出力)= 約$17,500
GPT-5.5$5,000(入力)+ $15,000(出力)= 約$20,000

差額: Qwen3.6-MaxはClaude Opus 4.7比で月間約$13,300のコスト削減。年間換算で約160万ドル(約2.3億円)の差になります。

ただし「安いから即採用」は危険です。後述するセキュリティ・品質面での確認が必要です。

Qwen3.6-Maxの強み:コーディング活用プロンプト10選

SWE-Bench Pro首位・Terminal-Bench 2.0首位の実力が最も発揮されるのは、コーディング・エージェント系タスクです。実際に研修先や自分自身のAI活用で試した結果を元に、すぐ使えるプロンプトを厳選しました。

プロンプト1:バグ自動診断と修正案生成

SWE-Bench型のタスクで最も得意とするのが「バグを渡して直す」パターンです。コーディングエージェント(Claude Code, Cursor, Roo Code)のバックエンドとして使う際の基本プロンプトです。

以下のエラーと関連コードを分析し、バグの根本原因を特定して修正案を提示してください。

【エラーメッセージ】
[ここにエラーを貼り付け]

【関連コード】
```[言語名]
[ここにコードを貼り付け]
```

以下の手順で回答してください:
1. エラーの根本原因(1〜2文で断言)
2. 修正箇所と修正後のコード(差分形式で)
3. 再発防止のための改善提案(任意)

不足情報があれば、作業開始前に質問してください。

プロンプト2:コードレビュー(セキュリティ観点)

以下のコードを、セキュリティ観点でレビューしてください。

```[言語名]
[ここにコードを貼り付け]
```

チェック項目:
- SQLインジェクション・XSS・CSRF等の脆弱性
- 認証・認可の不備
- シークレット・API keyの直書き
- 入力バリデーションの漏れ

各問題について:重大度(HIGH/MEDIUM/LOW)・発見箇所・修正案 の3点セットで報告してください。
問題がない項目は「✅ 問題なし」と明記してください。

プロンプト3:ターミナルエージェント向けシェルスクリプト生成

Terminal-Bench 2.0首位の強みを活かした用途です。複雑なシェルスクリプトをナチュラルランゲージで指示できます。

以下の要件を満たすシェルスクリプトを作成してください。

【OS】[Linux/macOS等]
【要件】
- [要件1]
- [要件2]
- [要件3]

【制約】
- エラー処理を必ず含める(set -euo pipefail)
- ログ出力を含める
- 冪等性を考慮する(何度実行しても同じ結果になるよう設計)

スクリプトの前に、処理フローの概要を3行で説明してください。
仮定した点は必ず「仮定:」と明記してください。

プロンプト4:リファクタリング指示(パフォーマンス改善)

以下のコードをリファクタリングしてください。

```[言語名]
[ここにコードを貼り付け]
```

目標:
- 実行速度の改善(ボトルネックを特定して対処)
- 可読性の向上
- テスタビリティの確保

Before/After形式で、変更前と変更後のコードを並べて提示してください。
各変更について「なぜ変更したか」を1行コメントで添えてください。

プロンプト5:テストコード自動生成

以下の関数に対するユニットテストを生成してください。

```[言語名]
[ここに関数を貼り付け]
```

【テストフレームワーク】[Jest/pytest/RSpec等]

以下のケースをカバーしてください:
- 正常系(期待通りの入力)
- 境界値(空配列、null、最大値/最小値)
- 異常系(不正入力、例外が発生するケース)
- エッジケース(関数の説明を読んで考えられるもの)

テストカバレッジ80%以上を目標にしてください。

プロンプト6:APIドキュメント自動生成(OpenAPI形式)

以下のAPIエンドポイントのOpenAPI 3.0形式ドキュメントを生成してください。

【エンドポイント情報】
- メソッド: [GET/POST等]
- パス: [例: /api/v1/users/{id}]
- 認証方式: [Bearer Token等]

【リクエスト例】
[ここに実際のリクエスト例を貼り付け]

【レスポンス例(正常時・エラー時)】
[ここに例を貼り付け]

YAML形式で出力してください。description フィールドは日本語で。

プロンプト7:レガシーコード移行計画の作成

以下のレガシーコード/システム情報を元に、モダン化の移行計画を作成してください。

【現状】
- 言語/フレームワーク: [例: PHP 5.6, jQuery]
- コード規模: [例: 約50,000行]
- 主な問題: [例: セキュリティ脆弱性、保守困難]

【移行先】
- 目標: [例: Python 3.12 + FastAPI, React]
- 期間: [例: 6ヶ月]
- チーム規模: [例: エンジニア3名]

以下を含めた移行計画を作成してください:
1. リスク評価(HIGH/MEDIUM/LOW)
2. フェーズ分け(推奨3〜5フェーズ)
3. 各フェーズの作業内容・期間・マイルストーン
4. 失敗リスクと軽減策

数字と判断の根拠を添えてください。

プロンプト8:コードの多言語対応(i18n)実装支援

以下のコードにi18n(多言語対応)を実装してください。

```[言語名]
[ここにコードを貼り付け]
```

【対応言語】日本語・英語(最低限。他言語は拡張可能な構造で)
【使用ライブラリ】[例: react-i18next / i18next / gettext]

作業手順:
1. ハードコードされた文字列をすべて抽出(リスト提示)
2. 翻訳キーの命名規則を提案
3. 変更後のコードと翻訳ファイルの雛形を提示

不足情報があれば最初に質問してください。

プロンプト9:プルリクエスト説明文の自動生成

以下のコード差分(diff)から、GitHubプルリクエスト用の説明文を生成してください。

```diff
[ここにgit diffの出力を貼り付け]
```

以下の構成で生成してください:
## 変更概要
(1〜3行で変更の目的を説明)

## 変更内容
(箇条書きで主な変更点を列挙)

## テスト方法
(レビュアーがどう動作確認すればよいか)

## 注意点
(レビュアーに特に見てほしい箇所や考慮事項)

日本語で、技術的に正確に記述してください。

プロンプト10:アーキテクチャ設計レビューと改善提案

以下のシステムアーキテクチャを評価し、改善案を提案してください。

【現在のアーキテクチャ】
[テキストまたはAsciiArt形式で構成を記述]

【システムの要件】
- トラフィック: [例: 月100万リクエスト]
- SLA: [例: 99.9%稼働率]
- チーム: [例: エンジニア5名]
- 予算: [例: AWS月額$5,000以内]

以下の観点で評価してください:
1. スケーラビリティ(現状と将来)
2. 信頼性・耐障害性
3. セキュリティ
4. 運用コスト
5. 開発生産性

各観点で「現状の評価(Good/Caution/Problem)→改善案→優先度」の形式で。

AI活用、何から始めればいい?

100社以上の研修実績をもとに、30分の無料相談で貴社の課題を整理します。

無料相談はこちら

業務活用プロンプト20選:営業・経理・分析・翻訳

コーディング以外の業務でも、Qwen3.6-Maxの長いコンテキスト(262K)と高い推論能力は活かせます。ただし「文章の細やかさ」はClaude Opus 4.7の方が優位な場面も多いため、「大量データの処理・分析・変換」系に絞って活用するのがポイントです。

営業・マーケティング(5選)

プロンプト11:長文RFP(提案依頼書)からの要件抽出

以下のRFP文書から、提案に必要な要件を構造化して抽出してください。

【RFP文書】
[ここに全文を貼り付け(最大100,000字程度まで対応)]

抽出してほしい項目:
1. 必須要件(Must)と推奨要件(Should)の分類
2. 評価基準・配点(記載があれば)
3. 提出期限・納期
4. 質問・確認が必要な不明点(3〜5点)
5. 競合排除につながるキーワード(自社に有利な条件)

表形式でまとめてください。数字と固有名詞は根拠を添えてください。

プロンプト12:競合分析レポートの自動生成

以下の競合企業情報から、比較分析レポートを作成してください。

【自社情報】
[自社の主要サービス・強み・価格帯]

【競合情報(各社)】
[各社のWebサイト情報・IR資料等を貼り付け]

以下の軸で比較してください:
- 提供価値(What)
- ターゲット顧客(Who)
- 価格・料金体系(How much)
- 差別化ポイント(Why us)

自社の「勝てる土俵」と「避けるべき土俵」を結論として明示してください。

プロンプト13:月次報告書からのインサイト抽出

以下の月次営業報告書から、経営判断に使えるインサイトを抽出してください。

【報告書】
[テキストをそのまま貼り付け]

以下の観点で分析してください:
1. KPIの前月比・前年同月比トレンド
2. 目標達成/未達の根本原因(仮説)
3. 来月の優先アクション(3つ、優先度順)
4. リスク要因(気になる数字や傾向)

経営者が5分で読める「Executive Summary」形式でまとめてください。

プロンプト14:顧客ヒアリング記録からのニーズ分析

以下の顧客ヒアリング記録(複数)を分析し、共通のニーズ・課題パターンを抽出してください。

【ヒアリング記録】
[複数のヒアリングメモを貼り付け]

分析してほしい内容:
1. 頻出キーワード・フレーズ(TOP10)
2. 顧客セグメント別の特徴的なニーズ
3. 明示的ニーズ vs 潜在ニーズの分類
4. プロダクト/サービス改善への示唆

個人を特定できる情報は伏せた上で分析してください。

プロンプト15:メール返信文の自動ドラフト(多数の問い合わせ処理)

以下の顧客問い合わせメールに対する返信案を作成してください。

【問い合わせ内容】
[ここに問い合わせ文を貼り付け]

【自社サービス・FAQ情報】
[ここに関連情報を貼り付け]

返信案の条件:
- 丁寧・親切なトーン(ビジネスメール標準)
- 問い合わせの全ての質問に答える
- 回答できない・確認が必要な点は「確認してご連絡します」と明記
- 署名は「[担当者名]」とプレースホルダーで

仮定した点は必ず「仮定:」と記載してください。

経理・財務(4選)

プロンプト16:決算書・財務データからのサマリー作成

以下の財務データを分析し、非財務担当者向けのサマリーを作成してください。

【財務データ(PL・BS等)】
[数値をテーブル形式またはCSVで貼り付け]

以下を含めてください:
1. 3行で読める概況(利益・流動性・成長性)
2. 前期比で「改善した指標」「悪化した指標」各3つ
3. 経営判断に必要なアクション(優先度順)

専門用語は括弧書きで説明を加えてください。数字の解釈は「仮定:」を明記してください。

プロンプト17:請求書データの突合・照合支援

以下の2つのデータを突合し、差異を報告してください。

【データA(発注記録)】
[CSVまたはテキスト形式で貼り付け]

【データB(請求書データ)】
[CSVまたはテキスト形式で貼り付け]

突合キー:[例: 発注番号、取引先コード]

報告形式:
- 一致件数・金額
- 不一致件数・金額(差異内容を明記)
- 要確認フラグ付きリスト

差異が5件以上の場合はサマリーのみ先に出し、詳細は後で出してください。

プロンプト18:経費精算書類の確認支援

以下の経費精算データを確認し、問題のある項目をフラグしてください。

【経費精算リスト】
[テキストまたはテーブルで貼り付け]

【社内規程のポイント】
[ここに規程の抜粋を貼り付け]

フラグする条件:
- 規程上限を超える項目
- 証憑(領収書等)が不明な項目
- 日付・金額の整合性が取れない項目

OK/FLAG/要確認 の3分類で一覧を出力してください。

プロンプト19:予算策定支援(前年実績からの推計)

以下の前年度実績データをもとに、次年度予算案を作成してください。

【前年度実績】
[月次または四半期の実績データを貼り付け]

【前提条件】
- 成長目標: [例: 前年比+20%]
- 固定費増加: [例: 人件費+10%、オフィス家賃変更なし]
- 新規投資: [例: システム更新費500万円]

月次・四半期・年次の予算案を表形式で出力してください。
根拠となった計算式を各行に添えてください。仮定は明記してください。

データ分析(5選)

プロンプト20:大量テキストデータのカテゴリ分類

以下のテキストデータを、指定カテゴリに分類してください。

【分類カテゴリ】

– [カテゴリA]: [定義]

– [カテゴリB]: [定義]

– [カテゴリC]: [定義]

– その他

【分類対象データ】

[大量のテキストデータを貼り付け(最大100,000字程度)]

出力形式:

| ID | テキスト冒頭50字 | カテゴリ | 確信度(高/中/低)| 理由 |

確信度「低」の項目は末尾にまとめ、人間によるレビューを推奨してください。

プロンプト21:アンケート自由記述の定量化

以下のアンケート自由記述回答を分析し、定量的なサマリーを作成してください。

【設問】
[ここに設問を記載]

【回答データ】
[自由記述の回答を貼り付け]

分析内容:
1. 頻出テーマTOP10(言及回数付き)
2. 感情分析(ポジティブ/ネガティブ/中立の割合)
3. 改善要望・意見の優先度付けリスト
4. 特に印象的な引用5件(そのまま引用)

個人を特定できる情報は伏せてください。

プロンプト22:ログデータからの異常検知支援

以下のシステムログを分析し、異常・警告パターンを特定してください。

【ログデータ】
```
[ここにログを貼り付け]
```

分析してほしいこと:
1. ERRORレベルのイベント一覧と発生頻度
2. 通常と異なるパターン(急増・急減)
3. エラーの相関関係(A→Bの順で発生するなど)
4. 推奨アクション(優先度HIGH/MEDIUM/LOWで)

不明な項目は「不明:」と記載してください。

プロンプト23:マーケットリサーチのシンセシス

以下の複数のリサーチレポートから、意思決定に使えるインサイトを統合してください。

【レポート1〜N】
[各レポートの内容を貼り付け]

統合してほしい内容:
1. 複数レポートで一致している「共通の事実」
2. レポート間で矛盾・異なる見解がある点
3. どのレポートの情報が最も信頼性が高いか(理由付き)
4. ビジネス判断への示唆(3点以内)

出典元(レポート名)を各情報に付与してください。

プロンプト24:KPIダッシュボード設計支援

以下の事業情報をもとに、KPIダッシュボードの設計案を提示してください。

【事業概要】
[ビジネスモデル・目標・チーム規模]

【現在追っている指標(もしあれば)】
[現状のKPI一覧]

【課題・改善したいこと】
[例: 意思決定が遅い、何を見ればいいか不明]

設計案に含める内容:
1. 推奨KPI一覧(3段階: 週次/月次/四半期)
2. Leading Indicator vs Lagging Indicatorの分類
3. 各KPIの定義式(分子・分母)
4. ダッシュボードのレイアウト案(テキストでの概略図)

翻訳・多言語処理(5選)

プロンプト25:技術文書の日英翻訳(一貫性重視)

以下の技術文書を日本語から英語に翻訳してください。

【用語集(統一表記)】
- [日本語用語1] → [英語翻訳1]
- [日本語用語2] → [英語翻訳2]

【翻訳対象】
[ここに日本語テキストを貼り付け]

翻訳条件:
- ネイティブビジネス英語(formal tone)
- 用語集の表記を必ず使う
- 不自然な直訳は意訳で対応
- 翻訳が困難・曖昧な箇所は「(要確認)」と注記

翻訳後に「確認が必要な箇所リスト」を付けてください。

プロンプト26:多言語対応メール文の一括生成

以下の日本語メール文を、指定言語に翻訳してください。

【日本語原文】
[ここにメール文を貼り付け]

【翻訳先言語】
- 英語(Global/North America向け)
- 中国語(簡体字)
- 韓国語

各言語版を、ビジネスメールとして自然な表現に意訳してください。
文化的に不適切な表現(日本式ビジネス敬語等)は現地慣習に合わせて調整してください。
調整した箇所は「(文化対応調整)」と注記してください。

プロンプト27:外国語資料の要点サマリー(日本語)

以下の外国語文書を読み、日本語で要点サマリーを作成してください。

【原文(英語/中国語等)】
[ここに外国語テキストを貼り付け]

サマリーの要件:
- 文字数: 500〜800字
- 構成: 概要(3行)→ 主要ポイント(5点)→ 日本企業への示唆
- 専門用語は日本語+括弧英語で表記
- 重要な数字・固有名詞は原文からそのまま引用

原文の主張と自分の解釈が混在しないよう、「原文によると」「筆者の主張では」等を使い分けてください。

プロンプト28:契約書の多言語対照表作成

以下の日本語契約書の重要条項を抽出し、英語対照表を作成してください。

【契約書】

[ここに契約書テキストを貼り付け]

対照表の形式:

| 条項番号 | 日本語条文(要約) | 英語翻訳 | リスクレベル |

リスクレベルの判定基準:

– HIGH: 解釈の余地があり、争いになりやすい条項

– MEDIUM: 一般的だが内容確認が必要

– LOW: 標準的な定型条項

この出力は参考情報です。契約内容の最終判断は法律専門家にご相談ください。

プロンプト29:海外SNS投稿の文化的適切性チェック

以下の投稿案(日本語)を、各国向けにローカライズしてください。

【投稿原稿】
[ここに投稿文を貼り付け]

【対象地域】
- 北米(Twitter/X)
- 東南アジア(LinkedIn)
- 中国(Weibo) ※検閲対応も考慮

各地域版を作成する際:
1. 文化的に不適切・誤解される表現を事前に指摘
2. ローカルの文化・慣習に合わせた自然な表現に調整
3. ハッシュタグは各地域の主流で使われるものを提案

「これは日本では普通だが海外では問題になる」点があれば最初に警告してください。

プロンプト30:多言語対応Q&Aベースの構築支援

以下のFAQ(日本語)を元に、多言語対応のQ&Aベースを構築するためのデータ整備をしてください。

【既存FAQデータ】
[Q&Aのリストを貼り付け]

作業内容:
1. FAQの重複・類似質問の統合(統合案を提示)
2. 各Q&Aへのカテゴリタグ付け
3. 英語・中国語(簡体字)への翻訳
4. 「このFAQではカバーできていない想定質問」を10件予測して追加案を提示

整備後のデータはCSV形式(Q, A, カテゴリ, 言語)で出力してください。

Qwen3.6-Max vs 競合比較:どう使い分けるか

「どのモデルを使えばよいか」は、コーディングエージェントを導入する企業から最もよく受ける質問です。研修現場での肌感覚も含めて整理します。

4モデルの用途別ポジショニング

事例区分: 想定シナリオ
100社以上のAI研修・導入支援の経験をもとに構成した典型的なモデル選定パターンです。

モデル最も向いている用途向いていない用途コスト感
Qwen3.6-MaxSWE-Bench型バグ修正、ターミナルエージェント、科学計算コーディング、大量コードレビュー(低コスト重視)機密データ処理、日本語の微妙なニュアンスが必要な文章生成★★★★☆(フロンティアで最安レベル)
Claude Opus 4.7SWE-Bench Verified型コーディング(最高精度)、長文コンテキスト(1M)、日本語品質、セキュリティ要件が厳しい環境大量処理(コスト面)★☆☆☆☆(最高価格帯)
DeepSeek V4 ProSWE-Bench Verified 80.6%でClaude直下の精度、コスト優先のコーディングエージェントコンテキスト128Kの壁、日本語品質★★★★☆($0.58/$3.48/M)
Qwen3.6-35B-A3B(オープン)機密データのオンプレコーディング、GPU環境があるチームのコスト最適化最高精度が必要なコーディング(73.4%がMax/Claude以下)★★★★★(API料金不要、GPU代のみ)

よくある選定パターン3つ

パターン1: コスト最優先でClaude代替を探している開発チーム

→ DeepSeek V4 Pro(SWE-Bench Verified 80.6%でClaude Opus 4.6に肉薄、$0.58/M)またはQwen3.6-Max(6ベンチ首位、$1.04/M)。まず小規模なA/Bテストで精度を自社タスクで確認してから移行を検討する。

パターン2: 機密データ・個人情報を扱う企業

→ クラウドAPIは使わず、Qwen3.6-35B-A3B(オープンウェイト・Apache 2.0)を社内サーバーにデプロイ。24GB VRAM以上のGPUがあればOllamaで動かせる。SWE-Bench Verified 73.4%と性能は控えめだが、データが外部に出ないメリットは大きい。

パターン3: 品質を最優先するプロダクション環境

→ まだClaude Opus 4.7一択。SWE-Bench Verified 87.6%は他の追随を許さないレベルで、実タスクの安定性も実証されている。コストは高いが「エラーによる手戻りコスト」を含めたトータルコストで比較すると、逆転することもある。

【要注意】よくある失敗パターンと回避策

失敗1:「ベンチマーク首位」で即本番移行する

❌ 「SWE-Bench Pro首位だからQwen3.6-Maxに全部切り替える」

⭕ 自社の代表的なタスク5〜10件でA/Bテストを実施し、品質・レイテンシ・コストを比較してから移行を決定する

なぜ重要か: ベンチマークは特定のタスクセットでの評価です。Towards AIの独立テストでも示されたように、「ベンチマーク首位 ≠ 自社ユースケースで最良」のことは多々あります。まず「Preview」の実力を自社環境で検証してからが鉄則です。

失敗2:セキュリティ審査なしで機密データを送る

❌ 「APIが使いやすいから、顧客データも含めてQwenに送る」

⭕ セキュリティ部門に事前相談し、中国系APIへのデータ送信ポリシーを確認する。機密データはオープンウェイト版のオンプレで処理する

なぜ重要か: 中国には「国家情報法」があり、中国企業は政府からのデータ提供要求に応じる義務があります。Alibaba Cloud(Qwen APIのバックエンド)経由で処理されるデータについて、日本の個情法(第28条「外国にある第三者への提供」)への対応も含めた事前確認が必要です。詳しくは【2026年最新】生成AI×個情法 完全対応ガイドを参照してください。

失敗3:「Preview版だから本番で使えない」と思い込む

❌ 「Previewと書いてあるから試さない」

⭕ 内部ツール・非クリティカルな用途で積極的に試し、本番移行の判断材料を早めに集める

なぜ重要か: OpenAI、Anthropic、Googleのモデルも最初はPreviewとして公開されることが多く、品質は本番レベルであることが多いです。Previewというラベルは「APIの仕様が変わる可能性がある」という意味合いが強く、品質が低いという意味ではありません。

失敗4:コーディング以外の全タスクにQwen3.6-Maxを使う

❌ 「安いから全部Qwen3.6-Maxに切り替えればコスト削減できる」

⭕ 日本語の微妙なニュアンスが必要な文章生成、カスタマーサポート対応、高度な推論が必要なタスクはClaude Opus 4.7を維持する

なぜ重要か: Qwen3.6-Maxはコーディング・エージェント特化で設計されており、自然言語の生成品質(特に日本語)はClaude Opus 4.7に比べて差があります。実際のRails chatアプリ構築テストでも、汎用的なタスクではClaude Opus 4.7の方が高スコアを出しています。

中国AI規制と日本企業のデータ安全保障

Qwen3.6-MaxをAPI経由で利用する前に、必ず法務・セキュリティ担当者と確認すべき事項があります。これは研修でも「導入前の必須チェックリスト」として必ず入れている内容です。

確認すべき3つのリスク

1. 中国国家情報法によるデータアクセスリスク

中国の国家情報法(第7条)では、中国企業・個人は国家情報活動を支援・協力する義務があります。Alibaba CloudのAPIを経由してデータを処理する場合、理論上は中国当局からのデータ提供要求が可能な状況が生まれます。

実際にAlibaba Cloudがデータを開示した事例は公知にはなっていませんが、リスクとして認識・評価・文書化することが、日本の個情法対応(第28条「外国にある第三者への提供」)で求められます。

2. 日本の個人情報保護法への対応

顧客・社員の個人情報を含むデータをQwen API経由で処理する場合、個情法第28条の「外国にある第三者への提供」規制が適用される可能性があります。相手国の個人情報保護制度の確認と、必要に応じた同意取得・十分性認定の確認が必要です。詳細は【2026年最新】生成AI×個情法 完全対応ガイドを参照してください。

3. コンテンツフィルタリング(検閲)リスク

中国系AIモデルには、特定のトピック(政治・歴史・宗教等)に関するコンテンツフィルタが組み込まれている可能性があります。一般的なコーディングタスクでは問題になりにくいですが、グローバルな社会問題を扱うコンテンツ生成には注意が必要です。

安全に使うための選択肢

方法概要メリットデメリット
Qwen3.6-Max API(Alibaba Cloud)クラウドAPI利用すぐ使える、高性能データが中国系クラウドを経由
Qwen3.6-Max API(OpenRouter経由)米国サーバー経由でAPI利用米国所在のサーバーが仲介最終的には同じモデルを使用
Qwen3.6-35B-A3B オンプレミスオープンウェイトを社内サーバーで実行データが外部に出ない、API料金不要GPU(24GB VRAM以上)必要、性能はAPI版以下

現時点での推奨: 機密データ・個人情報を含まない純粋なコーディング補助用途なら、Qwen3.6-Max APIを法務確認の上で利用する。機密度が高いデータを扱う場合は、オープンウェイト版のオンプレデプロイを検討する。

セルフホストガイド:Qwen3.6-35B-A3Bをローカルで動かす

Qwen3.6-Max-Previewはクローズドウェイトですが、Qwen3.6-35B-A3B(総35Bパラメータ・アクティブ3B・Apache 2.0)はオープンウェイトです。これをセルフホストすれば、データを外部に出さずに高性能なコーディングエージェントを構築できます。

必要スペック(Ollamaでの推奨環境)

精度設定モデルサイズ必要VRAM推奨GPUSWE-Bench Verified
FP16(フル精度)約70GB80GB以上A100 80GB × 173.4%(最大)
Q8量子化約38GB40GBA100 40GB or RTX 6000 Ada約70〜72%(推定)
Q4量子化(推奨バランス)約20GB24GBRTX 3090/4090 or RTX 6000約65〜68%(推定)

Ollamaでのセットアップ(コマンド例)

# Ollamaのインストール(Mac/Linux)
curl -fsSL https://ollama.ai/install.sh | sh

# Qwen3.6-35B-A3B Q4量子化版をダウンロード・実行
ollama run qwen3.6-35b-a3b:q4_K_M

# コーディングエージェントとして使う場合は、Open WebUIやContinueと連携
# Continue(VS Code拡張)の設定例:
# ~/.continue/config.json → "model": "qwen3.6-35b-a3b:q4_K_M", "apiBase": "http://localhost:11434"

セルフホストのメリット・デメリット

メリット:

  • データが完全に社内に閉じる(機密データ・個人情報も安全)
  • API料金不要(GPU運用コストのみ)
  • レイテンシが低い(インターネット経由がなくなる)
  • Apache 2.0ライセンスで商用利用・ファインチューニングが自由

デメリット・注意点:

  • Qwen3.6-Maxより性能が落ちる(SWE-Bench Verified 73.4% vs 推定82〜85%)
  • GPU調達コスト(RTX 4090: 約25〜35万円、A100: 100万円超)
  • モデルのアップデート管理が自社責任になる
  • 日本語品質は英語より若干低い傾向(Alibaba公式ベンチが限定的)

Qwen3.6-Maxのロードマップと今後の動向

Qwen3.6-Max-Previewは「Preview」という名前が示す通り、まだ開発途中です。今後の動向として注目すべき点を整理します。

正式版リリース予定(Q3 2026目途)

現在の「Max-Preview」が正式版になると、料金が下がる可能性があります。Tokenmix Blogの分析では、入力$0.50/M・出力$3.00/M程度までの値下げが予測されています。これはDeepSeek V4 Proと競争できる価格帯です。

パラメータ公開の可能性

現在は非公開のパラメータ数・MoE構成が、正式版リリースまたはその後に公開される可能性があります。Qwen過去シリーズの開示傾向からはオープンに向かう方向性がありましたが、クローズド戦略への転換で当面は非公開が続く可能性もあります。

マルチモーダル対応

Qwen3シリーズはテキスト専用ですが、過去のQwen-VLシリーズでマルチモーダル(画像・動画)の実力が示されています。Qwen4.0シリーズでは統合型マルチモーダルモデルが登場するという予測があります。

Qwenシリーズのオープンソース戦略の行方

2026年3月、Qwenの技術リードが離脱するというコミュニティへの影響が報告されました(Zenn, 2026年3月)。組織変更がQwenの開発方針(オープン/クローズドのバランス)にどう影響するかは注視が必要です。

競合モデルとの詳細比較

Qwen3.6-Maxと直接競合するモデルを「コーディングエージェント用途」で比較します。

Qwen3.6-Max vs DeepSeek V4 Pro

DeepSeek V4 Proは「SWE-Bench Verified 80.6%でClaude Opus 4.6に肉薄、$0.58/M入力」という驚異的なコストパフォーマンスを誇ります(参照: AkitaOnRails LLM Benchmarks 2026)。Qwen3.6-Maxの$1.04/Mより安く、SWE-Bench Verifiedでも上回っています。

一方、Qwen3.6-MaxはSWE-Bench Proや科学計算(SciCode)で優位。「どちらが自社のユースケースに近いか」でベンチを選んで比較するのが正解です。

Qwen3.6-Max vs Kimi K2.6

独立テストで87/100(Tier A)を記録したKimi K2.6は、「Opus 4.7より3.6倍安くTier A性能」として注目されています。コーディングエージェント市場でのライバルとして、今後Qwenと直接競合する可能性があります。

詳しい比較は【2026年最新】Qwen3.6完全比較|4モデル差と無料で使う方法を参照してください。

Qwen3.6-Max 実装ガイド:Claude Code / Cursorとの連携

Qwen3.6-MaxはOpenAI API互換なので、既存のClaude Codeバックエンド設定を変えずに切り替えられます。

OpenRouterを経由した設定(Claude Codeの場合)

# 環境変数の設定
export ANTHROPIC_API_KEY=
export ANTHROPIC_BASE_URL=https://openrouter.ai/api/v1

# Claude Codeの設定ファイル(~/.claude/settings.json)
{
  "model": "qwen/qwen3.6-max-preview",
  "apiBaseUrl": "https://openrouter.ai/api/v1"
}

# 注意: OpenRouter経由でもAnthropicメッセージ形式は使える
# ただしClaude Code特有の拡張機能(extended thinking等)は使えない場合あり

CursorでのLLM切り替え(OpenAI互換モード)

# Cursor → Settings → Models → Add Custom Model
# Model Name: qwen3.6-max-preview
# API Base: https://openrouter.ai/api/v1
# API Key: 

# または Alibaba Cloud Model Studio直接接続:
# API Base: https://dashscope.aliyuncs.com/compatible-mode/v1
# API Key: 

コーディングエージェントの詳細な設定方法については、Qwen3.6 業務プロンプト30選|営業・経理・企画のAI活用もあわせて参照してください。こちらはQwen3.6-Plusの業務活用に特化した記事です。MaxとPlusの使い分けの参考にもなります。

日本語での利用品質:実際のところどうか

コーディング以外の日本語タスクでQwen3.6-Maxを使う場合、品質面での確認が必要です。

日本語品質の現状評価

公式ベンチマーク(QwenChineseBench)は中国語特化であり、日本語の独立した評価データは限定的です。コミュニティの観測では「英語・中国語に比べて日本語品質はやや劣る」という報告があります。

一方、コーディングタスクでは「コードは言語を選ばない」ため、日本語の指示でPythonコードを生成するような用途なら品質差は小さいです。実際に私が研修先でテストした際も、日本語でのコード生成指示に対するQwen3.6-Plusの品質は十分実用的でした(コメントの日本語化なども問題なし)。

ただし、日本語の微妙なニュアンスが必要なビジネス文書の生成・翻訳・カスタマーサポート対応には、現時点ではClaude Opus 4.7を推奨します。

preserve_thinking機能:日本語での活用

Qwen3.6-MaxはAPIで`preserve_thinking`パラメータをサポートします。これはマルチターンエージェントで、前のターンの「思考プロセス」を次のターンに引き継ぐ機能です。日本語での長い対話でも、文脈の連続性が保たれます。

# preserve_thinking の利用例(OpenAI API互換)
import openai

client = openai.OpenAI(
    api_key="your-api-key",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

response = client.chat.completions.create(
    model="qwen3.6-max-preview",
    messages=[
        {"role": "user", "content": "このコードのバグを修正してください: ..."},
        {"role": "assistant", "content": "[前のターンの回答]"},
        {"role": "user", "content": "修正したコードに単体テストも追加してください"}
    ],
    extra_body={"preserve_thinking": True}  # 思考プロセスを引き継ぐ
)

Qwen3.6-MaxのAI業界への影響:中国AI戦略の転換点

Qwen3.6-Maxは単なる「高性能モデル」以上の意味を持っています。中国のAI産業戦略の転換点として見る必要があります。

「オープン→クローズド」の戦略的意味

Qwen3.6-Maxが初のクローズドウェイトになったことで、Alibabaは「最強モデルは商用API専用、中堅以下はOSS」というOpenAI/Anthropic型のビジネスモデルに移行しました。これは中国系LLMの従来戦略(全てオープン)からの明確な転換です。

影響として、DeepSeekがオープンウェイトを維持するなら「オープンソース最強」の座をDeepSeekに渡し、Qwenはクローズドのプレミアムモデルとして差別化を図る方向性が見えます。

「価格破壊」競争の継続

DeepSeek V4 Proの$0.58/M、Qwen3.6-Maxの$1.04/M、Kimi K2.6の価格競争は、Claude/GPTのAPIコストを構造的に圧迫しています。AnthropicやOpenAIがClaude 4.xやGPT-6系をどう価格設定するかは、今後の業界動向の焦点です。

DeepSeek V4の詳細分析は【2026年4月速報】DeepSeek V4完全解説を参照してください。

まとめ:Qwen3.6-Maxをどう位置づけるか

改めてQwen3.6-Max-Previewの評価をまとめます。

「使う価値がある」と言えるユーザー:

  • コーディングエージェントのAPIコストを月$5,000以上払っている開発チーム(Claude比で数倍のコスト削減効果)
  • SWE-Bench Pro型の高難度バグ修正やターミナル操作エージェントを構築したいチーム
  • Claude/GPT以外の選択肢を並走させてコスト・品質の最適解を探したい開発者

「まだ待った方がいい」ユーザー:

  • 機密データをAPIに送る必要がある企業(セキュリティ審査が必要)
  • SWE-Bench Verified最高精度が必要なプロダクション環境(現状Claude Opus 4.7が87.6%でトップ)
  • 日本語品質を最優先するユーザー(現状Claude Opus 4.7が優位)

Qwen3.6-Maxは「Claude代替」ではなく、「コーディングエージェントのコスト最適化選択肢」として位置づけるのが正確です。Preview期間中に自社タスクでテストし、正式版リリース後に本格移行を検討する——これが現時点での最も合理的なアプローチです。

まとめ:今日から始める3つのアクション

  1. 今日やること: OpenRouterで無料枠を使い、プロンプト1(バグ自動診断)を自社の実際のコードで試す。Claude Opus 4.7と品質を比べてみる
  2. 今週中: セキュリティ・法務担当者にQwenのデータポリシーを確認し、「使えるユースケース」「使えないユースケース」の社内基準を決める
  3. 今月中: 5〜10件の実タスクでA/Bテスト(Qwen vs Claude)を実施。コスト削減効果と品質のトレードオフを定量的に把握する

次回予告: 次の記事では「コーディングエージェント(Claude Code / Cursor / Roo Code)のモデル選定完全ガイド」をテーマに、実際のコスト比較・速度測定・精度検証データを公開します。


あわせて読みたい:


参考・出典


著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。X(@SuguruKun_ai)フォロワー約10万人。100社以上の企業向けAI研修・導入支援。著書『AIエージェント仕事術』(SBクリエイティブ)。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

ご質問・ご相談は お問い合わせフォーム からお気軽にどうぞ。

無料・初回相談

100社以上の支援実績|30分の無料相談で導入設計を一緒に組みます

Claude Code / Codex の社内展開・チーム導入・セキュリティ設計まで、貴社の業務と組織に合わせて伴走支援します。

  • 100社以上の企業支援実績
  • 初回30分無料・即日返信
  • 導入後3ヶ月の伴走付き

お問い合わせフォームから24時間以内にUravation担当者がご返信します。

佐藤傑
この記事を書いた人 佐藤傑

株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー10万人超)。100社以上の企業向けAI研修・導入支援を展開。著書累計3万部突破。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。

この記事をシェア

Claude Codeを本格的に使いこなしたい方へ

週1回・1時間のマンツーマン指導で、3ヶ月後にはClaude Codeで自走できる実力が身につきます。
現役エンジニアが貴方の業務に合わせてカリキュラムをカスタマイズ。

✓ 1対1のマンツーマン ✓ 全12回・3ヶ月 ✓ 実務ベースの指導
Claude Code 個別指導の詳細を見る まずは無料相談

Contact お問い合わせ

生成AI研修や開発のご依頼、お見積りなど、
お気軽にご相談ください。

Claude Code 個別指導(1対1・12セッション)をご希望の方はこちらから別途お申し込みください

Claude Code 個別指導 無料相談