调用链
调用链记录了请求在各个服务节点的处理时间、调用顺序 等信息,通过调用链的视角,可以分析一个请求在分布式系统中,从发起端到响应端经过的所有服务节点的调用关系和性能指标。
其价值包括但不限于:
- 快速定位问题:当系统出现性能瓶颈或故障时,调用链可以帮助快速定位问题发生的具体位置,提高故障排查效率。
- 性能优化:通过分析调用链中的耗时节点和瓶颈,可以针对性地进行优化,提升系统整体性能。
- 服务治理:调用链有助于了解服务之间的依赖关系,进行服务的治理和优化,提升系统的可维护性和可扩展性。
- 监控和告警:基于调用链的监控可以实时了解系统的运行状态,及时发现异常情况并发出告警,保障系统的稳定运行。
调用链列表
调用链列表页面,展示所有采集到的调用链(Traces)数据,可以帮助用户深层了解不同方法之间大调用关系、错误原因、性能瓶颈。
上方搜索框,可以输入不同的标签和标签值,快速过滤出目标数据,如服务名称、主机名称、Trace ID 等。
左侧快捷筛选框,可以通过多种筛选项快速过滤出目标调用链数据。调用链页面默认的筛选项有持续时间、状态、服务名称、操作、组件、RPC 方法、HTTP 方法、HTTP 状态码、HTTP 主机、HTTP 路径、HTTP URL。
右侧柱状图,展示所选中时间段内,调用链总数的分布情况。
右侧数据列表,默认展示所选中时间段内,每条调用链的发生时间、服务名称、操作、持续时间、RPC方法、HTTP状态码。列表默认按照时间倒序排列,用户点击「持续时间」表头,可以按照持续时间进行升序、倒序排列。
调用链详情
点击调用链列表中某条数据,右侧弹出抽屉页展示该条调用链详情页。
上方展示所 选中的 span 的基本信息,包括所属服务、操作、开始时间、持续时间、Trace ID。除此之外,点击右侧「相关日志」,即可跳转查看该条调用链的日志信息。
下方展示该条 span 的标签和事件详情。点击火焰图、瀑布图中的的 span 切换数据,此处便切换展示被选中的 span 信息。
中间通过火焰图、瀑布图两种形式,展示不同方法之间的调用关系及性能数据;服务拓扑展示的是当前调用链的服务调用关系。
- 火焰图:
- 鼠标悬浮在某条 span 数据上,会悬浮展示对应详情数据,包括服务名、资源名、开始时间、持续时间。
- 点击某条 span 数据,当前页面的上方的基本信息和下方的标签、事件详情信息,均属于被选中的 span 。
- 火焰图右侧的服务筛选框,可以帮助用户过滤出指定的服务信息。未被选中的服务的 span 会灰度展示;点击服务筛选框右上角的「恢复默认」,即可展示当前调用链所涉及的全部服务的 span 数据。
- 瀑布图:
- 鼠标悬浮在某条 span 数据上,会悬浮展示对应详情数据,包括服务名、资源名、开始时间、持续时间。
- 点击某条 span 数据,当前页面的上方的基本信息和下方的标签、事件详情信息,均属于被选中的 span 。
- 服务拓扑:展示当前调用链的服务调用关系。