From ab9aae7a270e5d4d14b8eb26dbe28fb1c9237b23 Mon Sep 17 00:00:00 2001 From: Ti Chi Robot Date: Fri, 2 Aug 2024 16:38:51 +0800 Subject: [PATCH] alert: remove keep_alive_total metric (#18227) (#18235) --- alert-rules.md | 15 --------------- 1 file changed, 15 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index c302a2212628..651c6eece4eb 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -63,21 +63,6 @@ summary: TiDB 集群中各组件的报警规则详解。 参考 [`TiDB_schema_error`](#tidb_schema_error) 的处理方法。 -#### `TiDB_monitor_keep_alive` - -* 报警规则: - - `increase(tidb_monitor_keep_alive_total[10m]) < 100` - -* 规则描述: - - 表示 TiDB 的进程是否仍然存在。如果在 10 分钟之内 `tidb_monitor_keep_alive_total` 增加次数少于 100,则 TiDB 的进程可能已经退出,此时会报警。 - -* 处理方法: - - * 检查 TiDB 进程是否 OOM。 - * 检查机器是否发生了重启。 - ### 严重级别报警项 #### `TiDB_server_panic_total`