监控项口径说明
本文档描述监控规则配置时,可供选择的「事件」和「指标」两类监控项的具体含义口径说明。
基于「事件」的监控
事件名称 | 目标对象 | 口径说明 |
---|---|---|
周期任务实例运行失败 | 包含:周期调度的任务实例和补数任务实例、周期实例的手动重跑。 不包含:手动运行的临时实例、实时同步任务实例 | 周期任务实例因各种原因(代码逻辑错误、超过、系统异常等)运行失败时,生成告警事件。 若周期任务配置了遇错重跑,自动重跑过程中不会生成告警事件,只在最后生成一次。 |
周期任务实例运行完成时间 | 包含:周期调度的任务实例、手动重跑的周期任务实例等。 不包含:手动运行的临时实例、补数任务的实例。 | 周期调度任务的完成时间超出预期时间点(在规定时间点没有运行结束),生成告警事件。 |
周期任务实例调度耗时(含等待时间) | 包含:周期调度的任务实例。 不包含:手动运行的临时实例、补数任务的实例、手动重跑的周期任务实例等。 | 周期任务实例,从计划时间到结束时间的总耗时超过阈值,生成告警事件。 是包含任务实例等待上游运行完成的时间在内的总耗时。 |
周期任务运行时间延迟 | 包含:周期调度的任务实例。 不包含:手动运行的临时实例、补数任务的实例、手动重跑的周期任务实例等。 | 周期任务实例实际进入运行状态的开始运行时间相比计划时间延迟超过阈值,生成告警事件。 |
任务实例运行耗时(不含等待时间) | 全部的任务实例。 含周期调度的任务实例、手动运行的临时实例、补数任务的实例、手动重跑的周期任务实例等。 | 实例自身的纯执行时间(不包含等待上游完成的时间)超过阈值,生成告警事件。 |
动态表刷新超时 | 动态表(Dynamic Table) | 动态表刷新操作超过设定的超时时间,生成告警事件。 |
流式sql任务执行失败 | 流式SQL(Continuous Job)任务 | 流式SQL任务的运行状态从“运行中”变化为"失败"时,生成告警事件。 |
质量规则校验失败 | 质量规则+目标表选择配置质量规则的表,当该表上某个规则校验失败后,会生成一个告警历史; | 数据质量校验规则的执行结果为"失败",生成告警事件。 |
质量规则校验超时 | 质量规则 | 数据质量校验规则的执行结果为“超时“,生成告警事件。 |
多表实时同步任务运行失败 | 多表实时同步任务 | 多表实时同步任务的状态从“运行中”变化为"失败"时,生成告警事件。 |
多表实时同步任务进入黑名单 | 多表实时同步任务 | 任务中某个表因连续同步失败被加入黑名单时,生成告警事件。 |
多表实时同步任务单表存量数据同步异常 | 多表实时同步任务 | 多表实时同步任务中,单个表的全量数据同步出现异常时,生成告警事件。 |
多表实时同步任务单表增量数据同步异常 | 多表实时同步任务 | 多表实时同步任务中,单个表的增量数据同步出现异常时,生成告警事件。 |
全增量一体同步单表存量数据同步异常 | 全增量一体同步任务 | 全增量一体同步任务中,单个表的存量数据同步出现异常时,生成告警事件。 |
全增量一体同步单表增量数据同步异常 | 全增量一体同步任务 | 全增量一体同步任务中,单个表的增量数据同步出现异常时,生成告警事件。 |
全增量一体同步任务运行失败 | 全增量一体同步任务 | 全增量一体同步任务的状态从“运行中”变化为"失败"时,生成告警事件。 |
全增量一体同步任务目标表字段变更失败 | 全增量一体同步任务 | 目标表字段的自动变更(Schema Evelution)遇到错误时,生成告警事件。 |
基于「指标」的监控
指标名称 | 目标对象 | 口径说明 |
---|---|---|
动态表刷新失败 | 动态表 | 动态表刷新操作失败次数 |
全增量一体同步任务延迟 | 全增量一体实时同步任务 | 数据同步的时间延迟 |
全增量一体同步任务单表同步失败 | 全增量一体实时同步任务 | 单表同步失败次数统计 |
多表实时同步任务延迟 | 多表实时同步任务 | 多表实时同步的整体延迟 |
多表实时同步任务作业failover | 多表实时同步任务 | 多表同步任务发生故障转移次数 |
多表实时同步任务读取点位延迟 | 多表实时同步任务 | 数据读取点位相对于源端的延迟 |
多表实时同步任务来源数据库读数延迟 | 多表实时同步任务 | 源数据库数据产生速率与同步速率的差异 |
多表实时同步任务数据同步状态异常 | 多表实时同步任务 | 数据同步状态的异常情况监控 |
联系我们