您可以通过云监控服务查看文件系统读写吞吐、IOPS、延时和元数据操作QPS等性能指标,同时可以对指标设置报警规则及时获取异常信息。本文介绍如何监控文件系统性能指标、设置报警规则、监控多个文件系统以及通过API获取监控数据。

前提条件

已开通云监控服务。

您可以登录云监控产品详情页,根据页面提示开通服务。

监控文件系统性能指标

  1. 登录云监控控制台
  2. 在左侧导航栏,选择Dashboard > 云产品监控大盘
  3. 在云产品名称下拉列表,选择文件存储NAS,然后选择地域和文件系统,查看监控图表。
    查看监控图表
    说明
    • 当图表显示无数据,说明目标文件系统长时间没有向服务端发起足够多的请求。
    • 您可以使用FIO工具测试文件系统性能并在云监控控制台查看性能指标图表。具体操作,请参见性能测试

      例如,您可以在挂载NAS的ECS实例上执行fio命令(挂载目录为/mnt):fio -numjobs=1 -iodepth=128 -direct=1 -ioengine=libaio -sync=1 -rw=randwrite -bs=1M -size=1G -time_based -runtime=600 -name=Fio -directory=/mnt,用于测试文件系统写吞吐指标。

    • 读写IOPS与元数据QPS的数据类型均为整型,若一分钟内的相关请求数小于60,则监控值显示为0。

设置报警规则

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警规则,单击创建报警规则
  3. 创建报警规则页面,配置如下相关信息。
    配置项 说明
    关联资源 关联资源区域,配置以下参数。
    • 产品下拉列表中,选择文件存储NAS
    • 资源范围下拉列表中,选择文件系统
    • 地域下拉列表中,选择目标文件系统所在地域。
    • 文件系统下拉列表中,选择目标文件系统。
    设置报警规则 根据需求设置报警规则,可添加多条报警规则。更多信息,请参见创建阈值报警规则
    通知方式 设置报警通知对象及报警等级等信息。

    单击快速创建联系人组,可创建联系人组。具体操作,请参见创建报警联系人和报警联系组

    说明 如果您要实现电话报警,请参见 购买电话报警资源包购买资源,并选中 电话+短信+邮件+钉钉机器人(Critical)
  4. 单击确认

    当文件系统的监控项超过设定阈值后会自动发送报警通知,使您及时获取监控数据异常。

监控多个文件系统

  1. 登录云监控控制台
  2. 设置分组。
    1. 在左侧导航栏,选择应用分组,单击创建组
    2. 创建应用分组页面,选择创建方式标准组创建,并设置相关参数。
      参数 说明
      基本信息 设置应用分组的名称和报警联系人组。取值:
      • 应用分组名称:设置应用分组名称。
      • 联系人组:用于接收报警通知的联系人组。您可以选择已有报警联系人组,也可以快速创建。
      监控报警 选择报警模板和通道沉默周期。取值:
      • 选择模板:您可以通过报警模板为应用分组初始化报警规则。

        创建报警模板的操作方法,请参见创建报警模板

      • 通道沉默周期:当报警未恢复正常时,重复发送报警通知的间隔时间。最短为5分钟,最长为24小时。
      初始化安装监控插件 您开启初始化安装监控插件后,云监控自动对应用分组中的主机安装云监控插件,以便采集主机的监控数据。
      事件监控 您选中订阅事件通知后,当应用分组内相关资源产生严重和警告级别事件时,云监控自动给您发送报警通知。
    3. 单击创建应用分组
  3. 添加产品。
    1. 应用分组页签,单击目标分组。
    2. 在分组详情页左侧导航栏,单击组内资源,然后单击添加产品
    3. 添加资源页面,选择要监控的产品和实例。
    4. 单击确认
  4. 查看监控图表。
    1. 应用分组页签,单击目标分组。
    2. 在分组详情页左侧导航栏,单击监控视图,在下拉列表选中目标文件系统,查看监控图表。
      查看监控图表
  5. 配置报警规则。
    1. 应用分组页签,单击目标分组。
    2. 在分组详情页左侧导航栏,单击报警规则
    3. 阈值报警页签,单击新建报警规则
    4. 报警规则区域,单击添加规则,配置规则信息,然后单击确定
      添加报警规则
    5. 报警机制区域,选择通道沉默周期联系人组
      设置报警机制
    6. 单击添加

通过API获取监控数据

NAS的监控数据支持通过云监控API查询,具体如下:

NAS的请求参数说明如下表所示。

名称 取值
Namespace acs_nas
MetricName IopsRead、IopsWrite、LatencyRead、LatencyWrite、QpsMeta、ThruputRead、ThruputWriteIopsRead
Dimensions {"userId":"xxxxxx","fileSystemId":"xxxxx"}