結論: Difyは「ノーコードでRAG・エージェント・ワークフローの全部入りAIアプリ」を構築できるオープンソースプラットフォームです。社内文書検索ボット・カスタマーサポートAI・業務自動化エージェントを、コードなしで本番環境に展開できます。
この記事の要点:
- 要点1: DifyはGitHubスター134,000超(2026年3月時点)で世界中の企業に採用されており、ChatGPT/Claude/Geminiを自由に切り替えてRAGアプリを構築できる
- 要点2: ナレッジベース(RAG)の構築はPDFをアップロードするだけで完了し、「ハイブリッド検索(ベクトル+全文検索)」設定で回答精度を最大化できる
- 要点3: 料金はSandbox無料〜Professional $59/月(約8,800円)で、社内利用ならセルフホストで永続無料も可能
対象読者: 社内向けAIチャットボット・FAQ bot・業務エージェントを自力で構築したいDX担当者・経営者
読了後にできること: 今日中にDifyの無料版でナレッジベースに社内文書を投入し、最初のAIチャットボットをデプロイできる
「社内のドキュメントを検索するAIチャットを作りたいけど、開発会社に頼むと数百万円かかると言われた…」
先日、食品製造業(従業員150名)の顧問先で、まさにこの相談を受けました。製品のQ&Aマニュアル・製造手順書・品質基準書が数百ページのPDFで分散していて、新人が正確な情報を探すのに毎回30分かかっているというんです。
その場でDifyを立ち上げ、Sandboxプラン(無料)でナレッジベースを作成。PDFを5本アップロードして設定完了まで約1時間。「この材料の使用期限は?」「この工程のNG判定基準は?」と入力すると、該当するPDFの内容を引用しながら正確に答えてくれました。担当者が「これ、うちの新人研修に使えます!」と声を上げたのが印象的でした。
この記事では、Difyを使ってAIエージェントをゼロから構築するステップバイステップ手順を全公開します。RAGの設定方法、ワークフローモードの活用法、Claude・GPT-4oとの連携設定、そして料金プランの選び方まで、100社以上のAI導入支援経験をもとに解説します。
AIエージェント全般の概念についてはAIエージェント導入完全ガイドを、既存のDify概要についてはDify入門ガイド(概要版)もあわせてご覧ください。
まず試す「今日中に動くもの」を作る3ステップ
Step 1:Difyアカウントの作成(5分)
- cloud.dify.aiにアクセス
- 「Get Started」→ GitHubまたはGoogleアカウントでサインアップ
- Sandboxプランが自動適用(200メッセージクレジット/月、クレカ不要)
Step 2:ナレッジベースに文書をアップ(10分)
- 上部メニュー「ナレッジ」→「+ナレッジベースを作成」
- PDFまたはWordファイルをドラッグ&ドロップ
- チャンク設定: 「自動」を選択(最初はデフォルトで十分)
- インデックス方法: 「ハイブリッド検索」を選択(精度最優先の場合)
- 「保存して処理」→ 数分でインデックス完了
Step 3:チャットボットに接続(5分)
- 「スタジオ」→「アプリを作成」→「チャットボット」を選択
- 「コンテキスト」の「+追加」から作成したナレッジベースを選択
- モデル選択: gpt-4o-miniまたはgemini-2.0-flash(低コスト)を選ぶ
- 「公開」→「チャットで試す」で即テスト可能
これだけで最初のRAG chatbotが動きます。「え、これだけ?」と毎回研修先で驚かれますが、本当にこれだけです。
Difyの機能構成は「3つのモード」で考える
| モード | 用途 | 難易度 | 代表的なユースケース |
|---|---|---|---|
| チャットボット | 対話型AIアシスタント | ★☆☆ | 社内FAQ bot、カスタマーサポート |
| エージェント | ツール使用・自律的タスク実行 | ★★☆ | メール自動返信、リサーチ補助 |
| ワークフロー | 複雑な処理フローの自動化 | ★★★ | 文書自動生成、多段階承認フロー |
AIエージェント構築のステップバイステップ
エージェント設定:基本の構成
チャットボットと異なり、AIエージェントは「ツール」を使って自律的に行動できます。Difyでは以下のツールがデフォルトで利用可能です。
- Webサーチ: SerpAPIやGoogle検索で最新情報を取得
- Wikipediaリーダー: 百科事典情報の参照
- 計算機: 数値計算の正確な実行
- カスタムツール: APIエンドポイントを登録して任意のツールを追加
エージェント作成の手順
- 「スタジオ」→「アプリを作成」→「エージェント」を選択
- 「システムプロンプト」を設定(エージェントの役割・制約・回答形式を定義)
- 「ツール」から使用するツールを有効化
- 「ナレッジ」から関連するナレッジベースを接続
- 「LLM」でモデルを選択(Claude推奨:長文推論に強い)
システムプロンプト例(社内リサーチエージェント):
あなたは{{company_name}}の社内リサーチアシスタントです。
ユーザーからの質問に対して、以下のルールに従って回答してください:
1. まず社内ナレッジベースを検索し、関連情報があれば引用してください
2. 社内情報で解決しない場合のみ、Webサーチを使用してください
3. 推測や不確かな情報を答える際は「推測:」と明記してください
4. 個人情報・機密情報を扱う可能性がある質問には回答せず、担当者に誘導してください
5. 回答の最後に「参照ソース」として引用元を必ず明記してください
不足している情報があれば、回答前に確認質問をしてください。RAGナレッジベースの精度を最大化する設定
ナレッジベースの精度は設定次第で大きく変わります。顧問先で試行錯誤してわかった最適設定を共有します。
チャンク設定の最適化
| 設定項目 | デフォルト | 推奨値 | 理由 |
|---|---|---|---|
| チャンクサイズ | 500 tokens | 300〜500 tokens | 文書の密度に応じて調整。技術文書は短め |
| チャンクオーバーラップ | 50 tokens | 50〜100 tokens | 文脈の連続性を維持するために重複を持たせる |
| インデックス方法 | ベクトル検索 | ハイブリッド検索 | ベクトル検索+全文検索の組み合わせで精度向上 |
| 検索件数(Top K) | 3件 | 5〜10件 | 多めに取得してLLMに絞り込みを任せる |
対応ファイル形式
2026年3月現在、以下のファイル形式をアップロード可能です。
- PDF(スキャンPDFにはOCR処理が必要)
- Word(.docx)
- PowerPoint(.pptx)
- テキスト(.txt、.md)
- CSV / Excel(表形式データ)
- URLからのウェブページ取り込み(クローリング機能)
精度向上のためのテクニック
研修先で実際に効果があった精度向上テクニックをご紹介します。
テクニック1:ドキュメントにメタデータを追加
アップロード後に各チャンクに「文書名」「作成日」「部門」などのメタデータを付与すると、検索精度が上がります。「2025年版の規程だけ参照して」という絞り込みも可能になります。
テクニック2:定期的なインデックス更新
文書を更新したら必ず「再インデックス」を実行してください。古いチャンクと新しいチャンクが混在すると矛盾した回答が出ます。
テクニック3:「回答不可」の条件を明示する
システムプロンプトに以下を追加:
「ナレッジベースに情報がない質問には
「申し訳ありませんが、その情報は現在の社内ナレッジベースには含まれていません。
[担当部署]にお問い合わせください」と回答してください。
不足している情報があれば最初に質問してから作業を開始してください。」ワークフローモードの活用
ワークフローは「複数の処理を順番に自動実行する」モードです。チャットボットより複雑なユースケースに対応できます。
ワークフロー例:問い合わせメールの自動分類・回答生成
以下はDifyのワークフローで実装できる処理フローの例です。
[開始ノード(メール本文を入力変数として受け取る)]
↓
[LLMノード1: 問い合わせカテゴリを分類]
↓
[条件分岐ノード: カテゴリに応じて処理を分岐]
├─ 製品に関する質問 → [ナレッジ検索ノード(製品マニュアルDB)] → [LLMノード2: 回答生成]
├─ 価格・契約に関する質問 → [HTTP Request(CRMから顧客情報取得)] → [LLMノード3: パーソナライズ回答]
└─ クレーム → [LLMノード4: エスカレーション文生成] → [担当者に転送]
↓
[終了ノード(生成された回答テキストを出力)]ワークフロー作成の実践ポイント
- 変数は「わかりやすい名前」をつける: input_email、classified_category、draft_replyのように命名する
- 各LLMノードに独立したシステムプロンプト: 「分類専用AI」「回答生成AI」を分けることで精度が上がる
- 出力形式を明示する: LLMノードのプロンプトに以下のように指定する
JSON形式で出力してください:
{
"category": "製品質問 | 価格問い合わせ | クレーム | その他",
"confidence": 0.0〜1.0,
"summary": "問い合わせ内容の1行要約"
}
仮定した点は必ず "assumption" フィールドに記載してください。Claude・GPT-4oとの連携設定
Anthropic(Claude)の設定
- 画面右上アイコン → 「設定」→「モデルプロバイダー」→「Anthropic」
- Anthropic API Keyを入力(console.anthropic.comで取得)
- 「保存」→ アプリ設定の「LLM」プルダウンから「claude-sonnet-4-6」等を選択
Claude(Anthropic)はDifyのRAG用途で特に相性が良いです。長文ドキュメントの文脈をしっかり保持して回答する精度が高く、社内ナレッジの横断検索に向いています。
OpenAI(GPT-4o)の設定
- 「設定」→「モデルプロバイダー」→「OpenAI」
- OpenAI APIキーを入力(platform.openai.comで取得)
- モデル選択: gpt-4o(最高精度)またはgpt-4o-mini(低コスト)
Google AI(Gemini)の設定
- 「設定」→「モデルプロバイダー」→「Google」→ API Keyを入力
- モデル選択: gemini-2.0-flash(コスパ最良、速度重視)またはgemini-3-pro(精度重視)
Geminiは入力コストが他モデルより低く、大量の問い合わせ処理に向いています。Difyの無料クレジットを温存しながら使うには、まずGeminiで試して、精度が足りなければClaudeやGPT-4oに切り替えるのがお勧めです。
料金プランの完全比較
2026年3月現在のDify公式プランです(dify.ai/pricing参照)。
| プラン | 月額(クラウド) | メッセージクレジット | ナレッジベース容量 | 推奨ケース |
|---|---|---|---|---|
| Sandbox | 無料 | 200/月 | 5MB | 個人学習・PoC・小規模テスト |
| Professional | $59/月($49年払い) | 5,000/月 | 5GB | 1〜5人の小チームでの運用 |
| Team | $159/月($132年払い) | 10,000/月 | 20GB | 10人以上のチーム・部門導入 |
| Enterprise | 要相談 | 無制限 | 無制限 | 全社展開・SOC2対応・SSO必要 |
| セルフホスト | サーバー代のみ | AIプロバイダー直接課金 | ディスク容量まで | 大量利用・機密データ管理 |
セルフホストの選択肢(コスト最小化)
Difyはオープンソースなので、自社サーバーやVPSで無制限に使えます。
# Dockerでのセルフホスト(最小構成)
git clone https://github.com/langgenius/dify.git
cd dify/docker
cp .env.example .env
docker compose up -dVPS(月額2,000〜5,000円)に上記を実行するだけで、本番レベルのDify環境が動きます。AIのAPI代はOpenAI・Anthropic・Googleに直接支払う形になります。月500回程度の利用であれば、AIのAPI代は数千円以内に収まることがほとんどです。
2026年の最新機能:MCP統合とHuman-in-the-Loop
Model Context Protocol(MCP)対応
2026年に入り、DifyはMCP(Model Context Protocol)の統合を強化しました。これにより、MCPに対応したツール(SlackやGitHub、データベース等)をDifyのエージェントから直接呼び出せるようになっています。専用の連携設定なしに「MCPサーバー」を追加するだけで、エージェントの能力を大幅に拡張できます。
Human-in-the-Loop(人間の承認ステップ)
ワークフローの任意のポイントに「人間の確認・承認ステップ」を挿入できる機能です。
実務での使い方:
- AIが顧客への返信メールを生成 → 担当者がSlackで承認 → 自動送信
- AIが発注書のドラフトを作成 → 上長が確認 → 発注システムに連携
- AIが採用候補者の書類審査 → HR担当が最終確認 → 次選考へ移行
「AIに全部任せるのは怖い」という企業に最適な機能です。AIの速度と人間の判断を組み合わせることで、信頼性と効率の両立が実現します。
【要注意】Difyでよくある失敗パターン
失敗1:ナレッジベースの文書を更新しても回答が変わらない
❌ 新しいバージョンの文書をアップロードしても古い回答が出続ける
⭕ 旧バージョンの文書を「削除」してから新バージョンをアップし、「再インデックス」を実行する
なぜ重要か: Difyのナレッジベースは上書きではなく追加方式です。古い文書を削除しないと、新旧が混在して矛盾した回答が出ます。研修先の医療機器メーカーで、旧バージョンの製品仕様が回答されて大混乱になった事例があります。
失敗2:システムプロンプトを空白のまま使う
❌ システムプロンプトを書かずに「とりあえず動かしてみる」
⭕ 最低でも「役割・言語・回答できない質問の範囲」の3つをシステムプロンプトで定義する
なぜ重要か: プロンプトが空だとAIは何でも答えようとします。社内向けシステムで政治・宗教・業務無関係な話題に答えてしまうと問題が発生します。
失敗3:Sandboxの200クレジットをテストで使い切る
❌ 動作確認のために何十回も試問していたらクレジットが尽きた
⭕ テスト段階ではgemini-2.0-flash-exp(無料枠大きめ)を自分のAPIキーで接続してテストし、Difyのクレジットは本番運用に温存する
失敗4:セルフホスト版でセキュリティ設定をしない
❌ Dockerで立ち上げてデフォルト設定のまま外部公開する
⭕ .envファイルでSECRET_KEYを変更、外部からのアクセスを必要最小限に制限、HTTPSを必ず設定する
なぜ重要か: Difyのデフォルト設定はローカル開発用です。社内外のユーザーがアクセスする場合はSSL証明書・認証の設定が必須です。
導入事例:食品製造業でのナレッジベース活用
事例区分: 想定シナリオ
以下は100社以上のAI研修・コンサル経験をもとに構成した典型的なシナリオです。
シナリオ: 食品製造業(従業員150名)
- 課題: 製品マニュアル・品質基準・製造手順書が数百ページのPDFに分散。新人が正確な情報を探すのに毎回30分かかる
- Dify活用: 全PDFをDifyナレッジベースに投入 → チャットボット形式で自然言語検索できる「社内ナレッジアシスタント」を構築
- 運用上の工夫: 「確認できない情報には回答せず担当者に誘導する」をシステムプロンプトで設定し、誤情報のリスクを制御
- 想定効果: 新人の情報検索時間の大幅短縮。先輩社員への質問件数の減少。ベテランのノウハウをナレッジベース化することで知識の属人化を解消
まとめ:今日から始める3つのアクション
- 今日やること: cloud.dify.aiでSandboxアカウントを作成し、手元にある業務PDFを1本アップロードして「このドキュメントの要点を教えて」と質問してみる(所要時間20分)
- 今週中: 本記事のエージェント設定手順に従って、自社の業務に合ったシステムプロンプトを書き、最初の社内用AIチャットボットをデプロイする
- 今月中: クラウド版 vs セルフホスト版のコスト試算をし、社内のデータガバナンスポリシーと照らし合わせて運用方針を決定する
Difyの最大の強みは「AIのRAG・エージェント・ワークフローが全部入っていて、コード不要で本番運用できる」点にあります。ゼロからPythonで実装すれば数週間かかる社内AIシステムが、Difyなら半日で動き始めます。ぜひ今日、最初の一歩を踏み出してみてください。
あわせて読みたい:
参考・出典
- Dify: Plans & Pricing — Dify公式(参照日: 2026-03-24)
- langgenius/dify – GitHub — GitHub(参照日: 2026-03-24)
- Dify Enterprise: Infrastructure for Building Agentic AI — Dify公式(参照日: 2026-03-24)
- Dify RAGの使い方を徹底解説!クラウド・ローカル両対応の高精度化ガイド — FLINTERSラボ(参照日: 2026-03-24)
- Difyを活用したRAG徹底解説:社内ナレッジをAIエージェントで活用する方法 — GMO即レスAI(参照日: 2026-03-24)
- Dify Review 2026: The No-Code AI Agent Builder Deep Dive — SimilarLabs(参照日: 2026-03-24)
著者: 佐藤傑(さとう・すぐる)
株式会社Uravation代表取締役。早稲田大学法学部在学中に生成AIの可能性に魅了され、X(旧Twitter)で活用法を発信(@SuguruKun_ai、フォロワー約10万人)。100社以上の企業向けAI研修・導入支援を展開。著書『AIエージェント仕事術』(SBクリエイティブ)。SoftBank IT連載7回執筆(NewsPicks最大1,125ピックス)。
ご質問・ご相談は お問い合わせフォーム からお気軽にどうぞ。




