阿里云容器服务是否支持GPU虚拟化型(vGPU)实例?

vGPU实例需要购买NVIDIA官方提供的GRID License才能正常工作,而阿里云并不提供License服务器。因此即使您创建了GPU虚拟化集群,vGPU实例也无法使用。因此,阿里云容器服务已不再支持在控制台选择vGPU实例作为集群节点。

如果您的业务对vGPU实例有强依赖,您可以向NVIDIA购买GRID License,自建License服务器。

说明
  • 更新ACK集群中vGPU实例的NVIDIA驱动License时,需要使用License服务器。
  • 购买ECS实例并参考NVIDIA官网教程搭建License服务器。更多信息,请参见NVIDIA

如果您的License服务器已经搭建完成,请参考以下步骤将vGPU实例加入ACK集群。

将vGPU实例加入ACK集群

  1. 提交工单,申请开放自定义系统镜像功能。
  2. 基于CentOS 7.X和Alibaba Cloud Linux 2制作自定义系统镜像,镜像中需要安装NVIDIA GRID驱动并且正确配置GRID License。具体操作,请参见使用实例创建自定义镜像在GPU虚拟化型实例中安装GRID驱动(Linux)
  3. 创建节点池。具体操作,请参见管理节点池
  4. 将vGPU实例加入到步骤3创建的节点池中,具体操作,请参见添加已有节点

后续相关步骤:更新ACK集群中vGPU实例的NVIDIA驱动License

更新ACK集群中vGPU实例的NVIDIA驱动License,具体操作,请参见更新ACK集群中GPU虚拟化型(vGPU)实例的NVIDIA驱动License