用 Dify 搭建企业内部 FAQ 机器人：从知识库上传到对话测试的完整流程

在企业导入 AI 应用的过程中，内部 FAQ 机器人通常是最容易验证价值、也最适合率先落地的场景之一。

原因很明确：组织内部存在大量高频、重复、规则相对清晰的问题，例如报销标准、请假流程、出差规范、信息安全要求、合同流程、IT 支持入口等。这些问题本身并不复杂，但会持续占用人事、行政、财务、法务与 IT 团队的响应时间。

借助 Dify，企业可以将制度文档、流程说明与常见问答组织为知识库，并通过可视化方式构建一个可测试、可迭代、可上线的 FAQ 机器人。

本文将围绕一个完整落地流程展开说明：从资料准备、知识库上传，到问答流程设计、对话测试与后续优化，帮助团队快速完成第一版内部 FAQ 机器人的搭建。

一、为什么企业通常从 FAQ 机器人开始

与更复杂的 Agent 或跨系统自动化相比，FAQ 机器人具备三个明显优势：

业务边界清晰
回答范围通常围绕制度、流程与内部文档展开，适合标准化建设。
上线门槛较低
在第一阶段，团队通常不需要引入复杂工具调用，就可以通过知识库检索与回答生成完成基本能力。
效果容易验证
只要准备一批真实问题，就能够快速评估命中率、回答质量与用户接受度。

因此，对于多数企业而言，FAQ 机器人是进入 AI 应用建设最稳妥的起点之一。

二、第一步：准备知识资料

FAQ 机器人的效果，很大程度上取决于知识资料的组织方式。

建议优先准备以下内容：

员工手册
就业规则或公司制度
报销与出差规范
信息安全与合规手册
IT 支持文档
常见流程说明
既有 FAQ 表格或客服话术

资料整理建议

在上传知识库前，建议先完成一轮基础清理：

删除明显重复内容
尽量避免一个文件覆盖过多主题
让每份资料尽量聚焦于一个清晰问题域
使用明确标题，例如“出差报销标准”“请假审批流程”“VPN 申请说明”

这一步的目标，是让后续检索更稳定，减少无关上下文对回答结果的干扰。

三、第二步：在 Dify 中建立知识库

在 Dify 中，FAQ 机器人的知识层通常由 Knowledge 提供。

一个常见做法是：

按主题建立知识库或文档分组
上传 PDF、Word、Markdown、网页内容等资料
由系统完成切分与向量化
在后续问答流程中调用检索结果

四、第三步：设计 FAQ 机器人的问答流程

一个基础但可用的 FAQ 机器人，通常可以按照如下逻辑构建：

用户提问
→ 问题分类
→ 知识库检索
→ 基于检索结果生成回答
→ 输出答案

在 Dify Workflow 中，这一流程通常对应以下节点：

Start / Input：接收员工问题
LLM 节点：对问题进行主题分类
Condition 节点：判断应使用哪类知识范围
Knowledge Retrieval：检索对应知识库
LLM Answer：结合上下文生成回答
Answer：输出最终结果

为什么建议增加“问题分类”步骤

在小规模知识库中，问题可以直接进入检索。但一旦资料规模增长，直接全库检索会明显降低稳定性。

加入分类层后，系统可以先判断用户问题属于哪一类，再只在相关知识中检索。例如：

“出差补贴标准是多少？” → 财务 / 出差管理
“副业是否允许？” → 人事制度
“忘记 VPN 密码怎么办？” → IT 支持

与全量盲检索相比，这种做法更适合正式企业场景。

五、第四步：设置关键提示词

在 FAQ 机器人中，最关键的提示词通常有两类：分类提示词与回答提示词。

1. 分类提示词

用于判断问题所属范围，例如：

你是企业内部问题分类助手。
请判断以下问题属于哪一类：
- 人事制度
- 财务报销
- 出差管理
- 信息安全
- IT 支持
- 其他

问题：{{user_query}}

2. 回答提示词

用于约束输出边界，避免模型超范围推断，例如：

你是企业内部 FAQ 助手。
请严格基于提供的参考内容回答问题。
要求：
- 不要凭空补充制度中没有的信息
- 如果资料不足，明确说明“当前资料中未找到明确依据”
- 优先使用简洁、可执行的表达
- 如有必要，标注文档或制度来源

员工问题：{{user_query}}
参考内容：{{context}}

在内部 FAQ 场景中，重点不是让回答“像聊天”，而是让回答具备明确依据、表达稳定、可直接执行。