您可以通过设置报警规则来定义报警系统如何检查监控数据,并在监控数据满足报警规则时发送报警通知。如果您对重要监控指标设置报警规则,则可在第一时间得知指标异常,并迅速处理故障。
背景信息
- 报警规则存在沉默期,当您的报警规则发生异常时,为避免报警风暴,24小时内只会发送一次报警通知。
- 云监控默认将您的阿里云账号添加为报警联系人,并自动为其创建报警联系组。
步骤一:创建报警联系人
- 登录云监控控制台。
- 在左侧导航栏,选择。
- 在报警联系人页签,单击新建联系人。
- 在设置报警联系人页面,填写报警联系人的姓名、手机号码、邮箱、旺旺和钉钉机器人,报警通知信息语言保持默认值自动。
说明 自动表示云监控根据当前阿里云账号注册时的语言,自动适配报警通知信息的语言。
- 信息验证无误后,单击确认。
- (可选)报警联系人邮箱和手机号码激活。
如果您设置了报警联系人的邮箱和手机号码,默认处于
等待激活状态。报警联系人需要根据邮件和短消息中的激活链接,在24小时内进行激活,否则无法收到报警通知。激活后,您可以在报警联系人列表中看到目标报警联系人的手机号码和邮箱。

步骤二:创建报警联系组
- 登录云监控控制台。
- 在左侧导航栏,选择。
- 单击报警联系组页签。
- 在报警联系组页签,单击新建联系组。
- 在新建联系组页面,填写报警联系组的组名,并选择报警联系人。
- 单击确认。
步骤三:创建报警规则
- 登录云监控控制台。
- 在左侧导航栏,选择。
- 在阈值报警页面,单击创建报警规则。
- 在创建报警规则页面,设置报警规则相关信息。

参数 |
说明 |
产品 |
云监控可管理的产品名称。例如:云服务器ECS。 |
资源范围 |
报警规则的作用范围。取值:
- 全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如:您设置了全部资源粒度的MongoDB CPU使用率大于80%报警,则只要用户名下有MongoDB CPU使用率大于80%,就会发送报警通知。资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。
- 实例:表示该规则只作用在某个具体实例上。例如:您如果设置了实例粒度的主机CPU使用率大于80%报警,则当该实例CPU使用率大于80%时,会发送报警通知。
|
规则名称 |
报警规则的名称。 |
规则描述 |
报警规则的主体,定义在监控数据满足指定条件时,触发报警规则。例如:CPU使用率5分钟平均值>=90%,持续3个周期,则报警服务5分钟检查一次数据是否满足平均值>=90%,只检测3次。
|
通道沉默周期 |
指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。 |
生效时间 |
报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。 |
通知对象 |
发送报警的联系人组。 |
报警级别 |
- 电话+短信+邮件+钉钉机器人
- 短信+邮件+钉钉机器人
- 邮件+钉钉机器人
|
弹性伸缩 |
如果您选中弹性伸缩,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域、弹性伸缩组和弹性伸缩规则。
|
日志服务 |
如果您选中日志服务,当报警发生时,会将报警信息写入日志服务。您需要设置日志服务的地域、Project和Logstore。
创建Project和Logstore的操作方法,请参见快速入门。
|
邮件备注 |
自定义报警邮件补充信息。填写邮件备注后,发送报警的邮件通知中会附带您的备注。 |
报警回调 |
填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。 |
- 单击确认。
在文档使用中是否遇到以下问题
更多建议
匿名提交