• Server Metrics

conductor使用spectator收集指标。https://github.com/Netflix/spectator

名称目的标签
workflow_server_error 服务器端错误发生的速率 方法名
workflow_failure 计算失败的工作流程 workflowName,status
workflow_start_error 计数器无法启动工作流 workflowName
workflow_running 柜台为否。的运行工作流 workflowName,version
task_queue_wait 任务在队列中花费的时间 任务类型
task_execution 执行任务所需的时间 taskType,includeRetries,status
task_poll 花费时间来轮询任务 任务类型
task_queue_depth 待处理任务队列深度 任务类型
task_timeout 计时器超时任务 任务类型
  • Worker Metrics

使用Java客户端时,会发布以下指标:

名称目的标签
task_execution_queue_full 记录执行队列的计数器已经饱和 任务类型
task_poll_error 轮询任务队列时出现客户端错误 taskType,includeRetries,status
task_execute_error 执行错误 任务类型
task_ack_failed 任务失败 任务类型
task_ack_error 任务ack遇到异常 任务类型
task_update_error 任务状态无法更新回服务器 任务类型
task_poll_counter 每次轮询完成时都会增加 任务类型
task_poll_time 时间轮询一批任务 任务类型
task_execute_time 执行任务的时间 任务类型

客户端的指标补充了从服务器收集的标识网络以及客户端问题。