监控和报警
MegaEase Cloud 平台可以托管用户的服务器,支持快速部署并管理常见的软件服务和云原生应用,让用户以此获得不被平台锁定,低成本,高可用的云原生平台。
本文档介绍如何使用 MegaEase Cloud 平台的监控和报警功能。
自定义仪表盘
本功能用于用户自定义需要的图表,并将这些图表组织成仪表盘。
首先你需要创建一个仪表盘。仪表盘是用来展示图表面板的空间。你可以使用如下所示的两个入口来创建一个新的仪表盘。
创建一个新的仪表盘时,只需要输入一个名字即可。
提交之后,新建的仪表盘会被自动选中,并且你可以在下拉列表中看到它。
接下来,你可以通过点击【新建面板】按钮来创建一个新的图表面板。
在【新建面板】对话框中,左边部分是预览区,右边部分是表单区。你可以在表单区中调整图表的配置,然后在预览区中即时的预览它。
表单区包含以下输入:
- 面板标题:用于指定新建面板的标题,显示在创建后的图表顶部。
- 分类:用于决定后面【服务】和【指标】的选择范围。当前可选值包括:MySQL, ElasticSearch, Redis, Zookeeper, kafka, MongoDB, Kubernetes, Prometheus, DockerApp, Docker, Host。
- 服务:用于决定图表中要展示哪个服务的数据。
- 图表类型:用于决定图表的展示样式。当前可选值包括:“Time-Series Chart”, “Zoom-Time-Series Chart”, “Bar Chart”, “Stack-Bar Chart”, “Line-Stack Chart”, “Pie Chart”。
- 指标:用于决定图表中要展示的是什么数据。不同的指标名称定义了一系列不同的时序数据。允许同时选择最多5个指标。
提交之后,即可在当前仪表盘中看到新创建的图表面板。
单个仪表盘中支持创建多个图表面板。用户也可以创建多个仪表盘来组织归类不同的图表面板。
告警规则配置
当我们部署完一个新的实例之后,会自动创建一些内置的告警规则。
对于内置的告警规则,用户可以禁用或者编辑,但不可以删除。
用户可以创建新的自定义告警规则。
首先,点击【添加规则】按钮。然后会看到如下所示的对话框。
对话框中包含如下输入项:
- 规则状态:决定当前规则是否启用。
- 规则名称:当前规则的名称,会作为告警通知的标题的一部分。
- 级别:用于标记告警规则的优先级。不同的优先级意味着不同的报警通知推送频率。
- 规则说明:作为规则触发时产生的告警通知的内容。
- 告警结束时的描述:作为规则触发结束时产生的告警消除通知的内容。
- 指标设置:用于描述告警如何被触发的细节,包括哪些指标将会被使用以及这些指标如何被使用。
【指标设置】本身是一个子表单。当它的【类别】字段选择不同的值时,表单会呈现不同的样子。
当【类别】字段的值是Default时,用户可以通过WEB界面来构造规则触发的逻辑。
当【类别】字段的值时Prometheus时,用户可以直接输入PromQL来定义规则的触发逻辑。
不同类别的情况下,有一些共同的输入项:
- 发生次数:用于确定规则被触发前,需要达到的最小的数据匹配次数。
- 持续时长:用于确定用于计算数据匹配的时间窗口。单位时秒。
一个新的告警规则一旦创建完成,即可在告警规则列表中看到它。
不同于内置的告警规则,自定义的告警规则除了可以被禁用和编辑,还可以被删除。
告警规则的编辑操作与创建操作类似,此处不再进行说明。