Clouisle云屿

对话与消息管理

按创建会话、查看消息、追踪工具与知识记录的顺序验证 Agent 的真实交互体验。

功能概述

对话与消息管理用于承载用户和 Agent 的真实交互过程。
它不仅展示回复内容,还负责记录会话标题、消息版本、附件、工具调用和知识上下文。

适用场景

适合下面几类任务:

  • 验证 Agent 的真实用户体验
  • 回看历史会话和变量填充值
  • 排查知识命中、工具调用或附件处理问题
  • 对比修改前后的回答变化

前置条件

开始前建议确认:

  • 已有一个可用 Agent
  • 如果需要工具或知识命中,相关能力已经接好
  • 已准备好几组真实用户输入

操作步骤

第 1 步:进入对话页面,发起一轮真实会话

测试时不要只输入“你好”或“你是谁”。
应直接用未来用户最真实的问题发起一次完整对话。

对话界面

这一步的目标是先确认对话入口本身可用,而不是马上分析输出质量。

第 2 步:先看会话级信息是否完整

一轮对话发起后,优先确认:

  • 会话标题是否可识别
  • 会话是否被正确保存
  • 再次进入时历史是否可回看

如果连会话级信息都不稳定,后面的消息追溯和运营都会很困难。

第 3 步:再看消息层是否清晰

接下来检查消息本身:

  • 用户消息和助手消息是否区分清楚
  • 再生成后是否能看出变化
  • 编辑后的消息是否会影响后续上下文

如果平台支持多版本消息,这一步尤其重要。

第 4 步:检查附件、工具和知识记录

如果这轮对话涉及:

  • 图片或文件附件
  • 工具调用
  • 知识库检索

就要进一步确认:

  • 附件有没有正常展示或被处理
  • 工具调用记录是否完整
  • 知识来源或上下文是否可追踪

第 5 步:用异常问题做一轮补充验证

当正常问题测试通过后,再补一轮异常输入测试,例如:

  • 信息不完整的问题
  • 模糊问题
  • 超出能力范围的问题

这一步能帮助你确认 Agent 在真实使用中会不会胡乱回答,或者是否能够继续追问。

结果验证

一套可投入使用的对话体验,至少应满足:

  • 会话可以被正常创建和保存
  • 历史消息可以回看
  • 工具和知识记录足以支持排障
  • 异常输入不会直接导致无依据回答

常见问题

为什么回答看起来不准,但我说不清问题在哪

建议先拆开看:

  • 会话是否保留了正确上下文
  • 工具是否真的被调用
  • 知识是否真的命中了正确内容

为什么消息记录这么重要

因为只看最终回答,你很难知道问题出在模型、知识还是工具。
消息和调用记录是排障时最直接的证据。

为什么要单独做异常输入测试

正常问题只能证明“理想情况可用”,不能证明系统在真实用户输入下是否稳定。

注意事项

  • 先验证会话链路,再分析回答质量
  • 结果异常时,优先回看消息和调用记录
  • 对用户可见内容和系统调试信息应尽量分层展示

目录