Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Dify のコアコンセプト:Chatbot・Agent・Workflow・Knowledge Base はそれぞれどのシナリオに適しているか

Dify は統一的な AI アプリケーションプラットフォームですが、異なるビジネスニーズが同一の構築方法に対応するわけではありません。

LangGenius では通常、四つのコアコンセプトを用いてチームが Dify を理解できるよう支援しています。

  • Chatbot
  • Agent
  • Workflow
  • Knowledge Base

これらは互いに代替する関係ではなく、異なる課題に対応する機能の組み合わせです。

1. Chatbot:ユーザー向けの対話入口に適している

Chatbot は最も理解しやすく、最も一般的な AI アプリケーションの形態です。対話形式でユーザーとやり取りするシナリオに適しています。

例えば:

  • 従業員のセルフサービス Q&A
  • カスタマーサポートアシスタント
  • 製品利用に関する問い合わせ
  • 基本的な情報収集と回答

「ユーザーが直接質問でき、自然言語で回答を得られるようにしたい」という目標であれば、Chatbot が最も適した入口となることが多いです。

Chatbot の特徴

  • インタラクションが直感的
  • リリースまでの障壁が低い
  • ユーザーニーズの迅速な検証に適している
  • ナレッジベースと組み合わせて FAQ アプリを容易に構築できる

Chatbot がより適するシナリオ

  • Q&A が中心
  • プロセスが比較的シンプル
  • ユーザーがチャットを通じて操作を完了したい
  • 重要なのは体験と応答であり、複雑なプロセス制御ではない

2. Agent:AI がツールを能動的に呼び出してタスクを完了するケースに適している

アプリケーションが単に「質問に答える」だけでなく、AI が目標に応じて自律的にツールを選択し、ステップを実行し、結果を統合する必要がある場合、それは Agent の領域です。

例えば:

  • 資料を検索してから結論を生成する
  • 外部インターフェースを呼び出してタスクを完了する
  • 複数のツール間で連携して複雑な問題に対処する
  • 目標に応じて次のアクションを動的に決定する

Agent の特徴

  • 単一回答ではなくタスク完了を重視
  • ツール呼び出しとの連携が可能
  • オープンエンドで複数ステップの問題に適している
  • より自律性の高い AI アプリの構築に適している

Agent がより適するシナリオ

  • タスクパスが完全には固定されていない
  • ツール呼び出しが必要
  • AI がコンテキストに基づいて戦略を判断する必要がある
  • ユーザーが提供するのは目標であり、明確なステップではない

3. Workflow:明確な制御が求められるビジネスプロセスに適している

多くの企業シナリオでは、Agent に完全に自律的な判断を委ねるのは適切ではなく、予測可能・再利用可能・ガバナンス可能な実行パスがより求められます。こうしたシナリオには Workflow が適しています。

例えば:

  • 入力内容をまず分類し、次に検索、生成、レビューを行う
  • フォームを読み取り、複数ステップの判断と分岐処理を行う
  • テキストを受け取り、要約・翻訳・フォーマット・返送を行う
  • ナレッジ検索、モデル生成、条件分岐を固定パイプラインとして連結する

Workflow の特徴

  • プロセスが明示的
  • ノードが制御可能
  • トラブルシューティングと最適化が容易
  • 企業の正式なビジネスプロセスにより適している

Workflow がより適するシナリオ

  • ステップが明確
  • 条件分岐が必要
  • 安定した出力が必要
  • 観測可能・デバッグ可能・再利用可能であること

Agent が「AI に目標達成の方法を自分で考えさせる」イメージであるのに対し、Workflow は「チームがプロセスを定義し、AI がそのプロセス内で実行する」イメージです。

4. Knowledge Base:企業のナレッジに基づいた質問への回答に適している

Knowledge Base は Dify においてナレッジ型アプリケーションを構築するための基盤です。モデルを置き換えるものではなく、モデルが質問に回答する際に企業自身の資料を参照できるようにするためのものです。

一般的なナレッジソースには以下が含まれます。

  • PDF
  • ドキュメントやマニュアル
  • FAQ
  • Web コンテンツ
  • 製品資料
  • 社内規程や説明文書

Knowledge Base の特徴

  • 回答にビジネスコンテキストを提供する
  • モデルが事実から離れて自由に生成するリスクを低減する
  • ナレッジ Q&A、検索拡張、社内アシスタントなどのシナリオをサポート
  • 多くの Chatbot や Workflow の重要なインフラとなる

Knowledge Base がより適するシナリオ

  • 既存の資料に基づいて質問に回答する必要がある
  • 企業が大量のドキュメント資産を持っている
  • 回答の根拠性と安定性を向上させたい
  • 「自社のビジネスを理解する」AI を構築したい

四つの関係性

Dify を理解する鍵は、これら四つのコンセプトを個別に記憶することではなく、それらがどのように組み合わさるかを理解することにあります。

一般的なアプリケーション構造は以下のようになり得ます。

  • Chatbot をフロントエンドの入口として使用
  • Knowledge Base で検索サポートを提供
  • Workflow で回答ロジックを組織
  • 必要に応じて Agent によるツール呼び出しを追加

つまり、Dify は単に「一つのチャットボット」を提供するのではなく、異なるレイヤーの AI アプリケーションを構築するための汎用フレームワークを提供しています。

どう選ぶべきか

以下のように判断できます。

コアの課題が以下の場合:

「ユーザーが直接質問できるようにしたい。」
Chatbot を優先的に検討してください。

コアの課題が以下の場合:

「AI に目標に基づいてタスクを実行させたい。」
Agent を優先的に検討してください。

コアの課題が以下の場合:

「明確で安定した制御可能な処理フローが必要。」
Workflow を優先的に検討してください。

コアの課題が以下の場合:

「AI に自社の資料に基づいて回答させたい。」
Knowledge Base の構築を優先してください。

LangGenius の視点

私たちは企業に理解していただきたいのは、AI アプリケーションには一つの形態しかないわけではないということです。

ある課題には使いやすい対話入口が必要であり、ある課題には制御可能なプロセスエンジンが必要であり、ある課題にはビジネスコンテキストを真に理解するナレッジ層が必要であり、ある課題にはツールを自律的に呼び出す実行能力が必要です。

Dify のプロダクト設計は、これらの能力が複数のシステムに分散するのではなく、同一プラットフォーム上で連携して機能するようにすることを目指しています。

まとめ

Chatbot、Agent、Workflow、Knowledge Base は抽象的な用語ではなく、企業が AI アプリケーションを構築する際に最も頻繁に遭遇する四つの能力ニーズです。

  • Chatbot は対話入口を解決する
  • Agent はタスク実行を解決する
  • Workflow はプロセスオーケストレーションを解決する
  • Knowledge Base はビジネスナレッジの接続を解決する

チームがこれら四つのコンセプトを明確に理解すれば、自分たちのシナリオに何が必要か、どこから始めるべきか、そして単発の AI 能力をどのように完全な企業アプリケーションへと段階的に拡張していくかをより適切に判断できるようになります。