v1.21.0 版本发布
· 4 min read
本次版本更新聚焦于「LLM 可观测」模块,以下若无特殊说明,均为「LLM 可观测」相关功能。
新增特性(Feature)
- 「数据集 - 实验」模块,新增多个实验对比功能:
- 对比多个实验,同一个评估维度的平均分,进行整体评估。
- 对比同一范例不同实验的 Output 内容、自动评估结果对比。
- 「Prompt 管理」:同一个 Prompt 的不同版本,可以一键对比 Prompt 内容的差异。
- 「应用分析」模块:新增「关联功能」页面,快速展示当前应用的数据都被哪些功能所使用。
- 「人工评估」、「自动评估」、和「Prompt 管理」模块的列表,新增与之相关的“关联应用”或“关联数据集”。使得不同模块之间的数据关联更加清晰。
优化(Improvement)
- 人工评估结果与自动评估结果通过后缀
[Human]
和[Auto]
区分,减少疑惑。 - 展示评估器、自动评估维度、自动评估结果的地方,可以直接直接查看对应详情页。
- 「应用分析 - 会话分析」:
- Session 、Trace 、Span 详情页,新增关联的
应用
和Prompt
信息,单击即可查看对应详情页。 - Session 、Trace 、Span 列表页的自定义列功能,新增分组管理,优化拖拽跳转排列顺序的交互。
- Session 、Trace 、Span 详情页,新增关联的
- 列表数据批量选择的复选框不再默认显示,优化交互。
- 所有页面的快捷筛选且可以展开或收起。
- 展示 Dify 上报的工作流节点名称。
缺陷修复(Bugfix)
- 修复 LLM 偶发已完成的实验状态变为错误的问题。
- 修复 LLM 自动评估时,若使用的模型欠费导致的数据问题。
- 修复 LLM 评估 Trace 详情记录,偶发模型识别错误的问题。
- 修复 LLM Prompt 管理,创建之前删除 Prompt 相同名称提示已存在的问题。
- 修复 LLM 克隆评估器后,列表没有自动刷新展示新的评估器的问题。
- 修复 LLM 评估队列,列表仅显示 100 条数据的问题。
- 修复 LLM 删除 Prompt, 新建同名的 Prompt 关联数据还存在的问题。
- 修复 LLM 人工队列,查询报错的问题。
- 修复 LLM 无法删除已经创建的模型 API 的问题。
- 修复告警详情显示时间异常的问题。
- 修复 License 导入过大的日志资源量报错的问题。
- 修复 License 显示单位 B 的问题。
- 修复服务详情数据库错误率显示 100% 的问题。