手册
监控和报警

监控和报警

MegaEase Cloud 平台可以托管用户的服务器,支持快速部署并管理常见的软件服务和云原生应用,让用户以此获得不被平台锁定,低成本,高可用的云原生平台。

本文档介绍如何使用 MegaEase Cloud 平台的监控和报警功能。

自定义仪表盘

本功能用于用户自定义需要的图表,并将这些图表组织成仪表盘。

首先你需要创建一个仪表盘。仪表盘是用来展示图表面板的空间。你可以使用如下所示的两个入口来创建一个新的仪表盘。

创建一个新的仪表盘时,只需要输入一个名字即可。

提交之后,新建的仪表盘会被自动选中,并且你可以在下拉列表中看到它。

接下来,你可以通过点击【新建面板】按钮来创建一个新的图表面板。

在【新建面板】对话框中,左边部分是预览区,右边部分是表单区。你可以在表单区中调整图表的配置,然后在预览区中即时的预览它。

表单区包含以下输入:

  • 面板标题:用于指定新建面板的标题,显示在创建后的图表顶部。
  • 分类:用于决定后面【服务】和【指标】的选择范围。当前可选值包括:MySQL, ElasticSearch, Redis, Zookeeper, kafka, MongoDB, Kubernetes, Prometheus, DockerApp, Docker, Host。
  • 服务:用于决定图表中要展示哪个服务的数据。
  • 图表类型:用于决定图表的展示样式。当前可选值包括:“Time-Series Chart”, “Zoom-Time-Series Chart”, “Bar Chart”, “Stack-Bar Chart”, “Line-Stack Chart”, “Pie Chart”。
  • 指标:用于决定图表中要展示的是什么数据。不同的指标名称定义了一系列不同的时序数据。允许同时选择最多5个指标。

提交之后,即可在当前仪表盘中看到新创建的图表面板。

单个仪表盘中支持创建多个图表面板。用户也可以创建多个仪表盘来组织归类不同的图表面板。

告警规则配置

当我们部署完一个新的实例之后,会自动创建一些内置的告警规则。

对于内置的告警规则,用户可以禁用或者编辑,但不可以删除。

用户可以创建新的自定义告警规则。

首先,点击【添加规则】按钮。然后会看到如下所示的对话框。

对话框中包含如下输入项:

  • 规则状态:决定当前规则是否启用。
  • 规则名称:当前规则的名称,会作为告警通知的标题的一部分。
  • 级别:用于标记告警规则的优先级。不同的优先级意味着不同的报警通知推送频率。
  • 规则说明:作为规则触发时产生的告警通知的内容。
  • 告警结束时的描述:作为规则触发结束时产生的告警消除通知的内容。
  • 指标设置:用于描述告警如何被触发的细节,包括哪些指标将会被使用以及这些指标如何被使用。

【指标设置】本身是一个子表单。当它的【类别】字段选择不同的值时,表单会呈现不同的样子。

当【类别】字段的值是Default时,用户可以通过WEB界面来构造规则触发的逻辑。

当【类别】字段的值时Prometheus时,用户可以直接输入PromQL来定义规则的触发逻辑。

不同类别的情况下,有一些共同的输入项:

  • 发生次数:用于确定规则被触发前,需要达到的最小的数据匹配次数。
  • 持续时长:用于确定用于计算数据匹配的时间窗口。单位时秒。

一个新的告警规则一旦创建完成,即可在告警规则列表中看到它。

不同于内置的告警规则,自定义的告警规则除了可以被禁用和编辑,还可以被删除。

告警规则的编辑操作与创建操作类似,此处不再进行说明。