对话与消息管理
按创建会话、查看消息、追踪工具与知识记录的顺序验证 Agent 的真实交互体验。
功能概述
对话与消息管理用于承载用户和 Agent 的真实交互过程。
它不仅展示回复内容,还负责记录会话标题、消息版本、附件、工具调用和知识上下文。
适用场景
适合下面几类任务:
- 验证 Agent 的真实用户体验
- 回看历史会话和变量填充值
- 排查知识命中、工具调用或附件处理问题
- 对比修改前后的回答变化
前置条件
开始前建议确认:
- 已有一个可用 Agent
- 如果需要工具或知识命中,相关能力已经接好
- 已准备好几组真实用户输入
操作步骤
第 1 步:进入对话页面,发起一轮真实会话
测试时不要只输入“你好”或“你是谁”。
应直接用未来用户最真实的问题发起一次完整对话。

这一步的目标是先确认对话入口本身可用,而不是马上分析输出质量。
第 2 步:先看会话级信息是否完整
一轮对话发起后,优先确认:
- 会话标题是否可识别
- 会话是否被正确保存
- 再次进入时历史是否可回看
如果连会话级信息都不稳定,后面的消息追溯和运营都会很困难。
第 3 步:再看消息层是否清晰
接下来检查消息本身:
- 用户消息和助手消息是否区分清楚
- 再生成后是否能看出变化
- 编辑后的消息是否会影响后续上下文
如果平台支持多版本消息,这一步尤其重要。
第 4 步:检查附件、工具和知识记录
如果这轮对话涉及:
- 图片或文件附件
- 工具调用
- 知识库检索
就要进一步确认:
- 附件有没有正常展示或被处理
- 工具调用记录是否完整
- 知识来源或上下文是否可追踪
第 5 步:用异常问题做一轮补充验证
当正常问题测试通过后,再补一轮异常输入测试,例如:
- 信息不完整的问题
- 模糊问题
- 超出能力范围的问题
这一步能帮助你确认 Agent 在真实使用中会不会胡乱回答,或者是否能够继续追问。
结果验证
一套可投入使用的对话体验,至少应满足:
- 会话可以被正常创建和保存
- 历史消息可以回看
- 工具和知识记录足以支持排障
- 异常输入不会直接导致无依据回答
常见问题
为什么回答看起来不准,但我说不清问题在哪
建议先拆开看:
- 会话是否保留了正确上下文
- 工具是否真的被调用
- 知识是否真的命中了正确内容
为什么消息记录这么重要
因为只看最终回答,你很难知道问题出在模型、知识还是工具。
消息和调用记录是排障时最直接的证据。
为什么要单独做异常输入测试
正常问题只能证明“理想情况可用”,不能证明系统在真实用户输入下是否稳定。
注意事项
- 先验证会话链路,再分析回答质量
- 结果异常时,优先回看消息和调用记录
- 对用户可见内容和系统调试信息应尽量分层展示