全部产品
云市场

监控与报警

更新时间:2020-03-20 12:16:29

HBase增强版使用云监控(开箱即用的企业级开放型一站式监控解决方案,完整使用请参考其相关介绍)实现系统的监控与报警。本文介绍如何配置监控和配置报警。

监控

HBase增强版使用新版云监控,以实例为粒度组织和展示监控数据。目前有两种方式来查看某个HBase增强版实例的监控数据。

  • (推荐)通过HBase控制台跳转到该实例的云监控页面
  • 通过云监控的Dashboard按region和实例id搜索

注意:

通过HBase控制台查看监控(推荐)

(1)进入HBase控制台,选择您要查看监控数据的HBase增强版实例,点击实例名,进入实例的基本信息页面;点击左侧的监控与报警按钮,进入监控跳转页面,如下图所示:hbaseue-cms

(2)点击跳转至云监控,即可进入该实例的云监控页面。如下图所示:hbaseue-monitor


特别说明

  • HBase增强版的监控数据组织不再依赖云监控的应用分组特性,HBase控制台不会再为每个实例自动创建应用分组,也不再需要用户的RAM授权。如果您只看监控,不配报警,是不需要操作云监控的应用分组的
  • 对于独立部署的Solr实例,可以从Solr控制台的监控报警页面跳转,也可以从其关联的HBase增强版实例进行跳转,二者均会跳转到同一个监控页面。此时,虽然Solr是独立部署的,但该实例归属于某个HBase增强版实例,所有的监控数据都以HBase增强版实例进行组织的
  • 本方法适用于云HBase的所有产品形态,包括HBase标准版/HBase增强版/BDS/Solr

通过云监控Dashboard按Region和实例Id查看监控

通过云监控的Dashboard功能,可以搜索并查看你的账号下的所有云HBase实例的监控。步骤如下:

(1)进入云监控控制台,点击左侧的Dashboard -> 云产品监控,并在右侧的产品列表中,输入hbase。云监控会自动列出云HBase的具体部署形态,选择HBase增强版来查看增强版的监控,如下图所示:hbaseue-cms-dashborad

(2)在资源列表中,选择您的实例所在的Region和实例Id,查看该实例的监控:hbaseue-cms-chooseregion

通过选择region和实例id,可以查看当前账号下购买的所有HBase实例的监控。


特别说明

  • 本方法不适用于HBase标准版,适用于其他所有产品形态
  • 对于独立部署的Solr实例,若要使用本方法查看监控,请在实例列表中选择与Solr实例关联的HBase增强版实例的ID,而不是Solr实例的ID。

报警

云监控提供了多种报警配置方式,这里,我们推荐使用应用分组来为HBase进行报警配置。云监控引入应用分组的概念来组织被监控的实例,并以应用分组为粒度进行报警配置。主要的操作有:创建应用分组(或使用已经存在的分组),向分组中添加要报警的HBase实例,配置报警规则。下面我们详细介绍每一步操作:

(1)创建(或复用)应用分组

进入云监控的控制台,点击左侧应用分组,选择您要配置报警的分组。或者创建新的分组。注意,创建新分组时,不勾选初始化安装监控插件,不需要动态添加实例

(2)向应用分组中添加需要报警的实例

准备好应用分组后,我们可以向其中添加需要报警的HBase实例。点击您的应用分组,进入分组的详情页。选择组内实例,点击添加产品来添加需要报警的HBase增强版的实例。如下图所示:hbaseue-warn-addinstance

(3)为应用分组添加报警规则

在准备好分组,以及分组中的实例后,我们可以为这个分组添加一系列的报警规则,这些规则会对分组中的所有实例生效。点击左侧的报警规则,点击新建报警规则,创建报警规则,如下图所示:hbaseue-warn-createrule

注意:报警指标的单位是预置的,不需要用户输入。比如,存储空间使用百分比,单位是%。如您想配置存储水位超过80%报警,则应在报警条件中输入80,而不是0.8。如下图所示:hbaseue-warn-metric

(4)配置报警的其他信息(如联系人)

配置好报警规则后,需要关注报警的另外两个信息:

  • 通道沉默周期:表示连续触发报警的最小周期。如下图所示,设置为30分钟,则表示30分钟内该指标在这个应用分组内最多触发一次
  • 联系人组:表示这个报警在触发后,通知给谁

hbaseue-warn-otherparam

如果您还未配置联系人分组,请在云监控的控制台中配置,如下图所示:contact

其他特别说明(重要)

关于实例存储水位报警的特别说明

HBase实例在存储使用比例达到95%时会自动锁定集群,禁止写入。如果发生禁写,会影响业务。因此,所有的HBase实例都会默认配置一个存储水位报警规则,在水位达到80%时报警。这个规则是对用户透明的,如果您想修改这个规则,或者禁用此规则,请钉钉联系云HBase答疑来修改。

另外,如果您通过云监控为存储使用比例显式配置了一个报警规则,系统默认的报警规则依然有效(不会被您配置的规则覆盖)。此时,如果您希望移除系统默认规则,请钉钉联系云HBase答疑进行修改。