当您的物联网平台资源使用达到报警规则中设置的值后,将触发报警。阿里云将发送报警信息到您设置的联系人通知组。本文介绍报警信息内容。

阈值报警信息

当阈值报警规则被触发后,通知联系人将收到类似如下报警信息邮件。


报警邮件
表 1. 报警信息内容说明
字段 说明
物联网平台实例 报警触发对象信息。包含触发报警规则的产品Key(productKey)、实例ID(instanceId)和所在地域ID(regionId)。
报警类目 显示为报警类目名称代码,指阈值报警规则描述中选择的报警类目。

如示例中,“MessageCountForwardedThroughRuleEngine_MNS”对应类目为“规则引擎消息流转次数(MNS)”,表示在一定时间内,规则引擎流转数据到消息服务(MNS)的次数超过了报警规则中设置的阈值。

具体类目名称代码说明,请参见下表:阈值报警类目说明表。

告警时间 发生告警的时间。
计数值 规则所监控类目的消息量、消息流转次数、或在线设备数量。
持续时间 数量超过阈值的持续时长。
规则详情 您在云监控控制台设置的阈值报警规则详情。
表 2. 阈值报警类目说明表
类目代码 说明
MessageCountForwardedThroughRuleEngine_DATAHUB 规则引擎消息流转次数(DATAHUB),即规则引擎流转数据到DataHub的次数。
MessageCountForwardedThroughRuleEngine_FC 规则引擎消息流转次数(FC),即规则引擎流转数据到函数计算(Function Compute)的次数。
MessageCountForwardedThroughRuleEngine_MNS 规则引擎消息流转次数(MNS),即规则引擎流转数据到消息服务(Message Service)的次数。
MessageCountForwardedThroughRuleEngine_MQ 规则引擎消息流转次数(MQ),即规则引擎流转数据到消息队列(RocketMQ)的次数。
MessageCountForwardedThroughRuleEngine_OTS 规则引擎消息流转次数(OTS),即规则引擎流转数据到表格存储(Table Store)的次数。
MessageCountForwardedThroughRuleEngine_RDS 规则引擎消息流转次数(RDS),即规则引擎流转数据到云数据库RDS版的次数。
MessageCountForwardedThroughRuleEngine_REPUBLISH 规则引擎消息流转次数(REPUBLISH),即规则引擎流转数据到物联网平台其他Topic的次数。
MessageCountForwardedThroughRuleEngine_TSDB 规则引擎消息流转次数(TSDB),即规则引擎流转数据到时序时空数据库(TSDB)的次数。
MessageCountSentFromIoT_HTTP_2 平台发出的消息量(HTTP/2),即使用物联网平台通过HTTP/2协议发出的消息数量。
MessageCountSentFromIoT_LoRa 平台发出的消息量(LoRa),即使用物联网平台通过LoRa协议发出的消息数量。
MessageCountSentFromIoT_MQTT 平台发出的消息量(MQTT),即使用物联网平台通过MQTT协议发出的消息数量。
MessageCountSentToIoT_CoAP 发送到平台的消息量(CoAP),即使用物联网平台通过CoAP协议发出的消息数量。
MessageCountSentToIoT_HTTP 发送到平台的消息量(HTTP),即设备通过HTTP协议发送到物联网平台的消息数量。
MessageCountSentToIoT_HTTP/2 发送到平台的消息量(HTTP/2),即设备通过HTTP/2协议发送到物联网平台的消息数量。
MessageCountSentToIoT_LoRa 发送到平台的消息量(LoRa),即设备通过LoRa协议发送到物联网平台的消息数量。
MessageCountSentToIoT_MQTT 发送到平台的消息量(MQTT),即设备通过MQTT协议发送到物联网平台的消息数量。
OnlineDevicesCount_MQTT 实时在线设备数(MQTT),即使用MQTT协议接入物联网平台的在线设备数量。
DeviceEventReportError 设备事件上报失败数。
DevicePropertyReportError 设备属性上报失败数。
DevicePropertySettingError 设备属性设置失败数。
DeviceServiceCallError 设备服务调用失败数。

事件报警信息

当事件报警规则被触发后,通知联系人将收到类似如下报警信息邮件。


报警邮件
表 3. 报警信息内容说明
字段 说明
事件名称 显示为报警事件名称代码。如示例中“Device_Connect_QPM_Limit”表示“任一设备每分钟最大连接请求数达到上限”。

具体事件名称代码对应的事件名称,请参见下表:事件类目说明表。

报警对象 报警触发的资源。
  • resourceId:资源ID。信息结构:
    acs:iot:$regionid::instance/$instanceId/product/$productKey/device/$deviceName
  • 资源名:实例ID。iot-public即公共实例。
  • 分组id:设备所属分组ID。若无分组,该字段值为空。
事件等级 目前均为WARN(告警)。
发生事件 事件报警的发生时间。
事件状态 目前均为Fail,表示连接请求数或消息发送QPS达到上限后,后续请求失败。
详情 触发报警的资源信息,JSON格式。包含地域ID(regionId)、实例ID(instanceId)、 产品Key(productKey)和 设备名称(deviceName)。其中,productKey和deviceName仅出现在设备每分钟最大连接请求数达到上限和设备上、下行消息QPS达到上限的报警信息中。
表 4. 事件类目说明表
事件名称 说明
Device_Connect_QPM_Limit 任一设备每分钟最大连接请求数达到上限。
Device_Uplink_QPS_Limit 任一设备上行消息QPS达到上限。
Device_Downlink_QPS_Limit 任一设备下行消息QPS达到上限。
Account_Connect_QPS_Limit 当前账号每秒最大连接请求数达到上限。
Account_Uplink_QPS_Limit 当前账号上行消息QPS达到上限。
Account_Downlink_QPS_Limit 当前账号下行消息QPS达到上限。
Account_RuleEngine_DataForward_QPS_Limit 当前账号规则引擎数据流转QPS达到上限。