文档

安装并使用Deepnccl

更新时间:

Deepnccl是为阿里云神龙异构产品开发的用于多GPU互联的AI通信加速库,能够无感地加速基于NCCL通信算子调用的分布式训练或多卡推理等任务。本文主要介绍在Ubuntu或CentOS操作系统的GPU实例上安装和使用Deepnccl的操作方法。

前提条件

已创建阿里云GPU实例,且GPU实例的操作系统为Ubuntu或CentOS。

安装Deepnccl

根据GPU实例的不同操作系统,安装Deepnccl有所不同,具体操作如下所示:

说明

安装Deepnccl时,系统会自动同时安装aiacc-nccl-plugin,确保了Deepnccl的正常使用。

  • Ubuntu操作系统

    1. 执行以下命令,下载Deepnccl的.deb安装包。

      本步骤以下载Deepnccl 2.0.1版本为例。

      wget https://aiacc.oss-accelerate.aliyuncs.com/nccl/deb/deep-nccl-2.0.1.deb
    2. 执行以下命令,安装Deepnccl。

      dpkg -i deep-nccl-2.0.1.deb
    3. 执行以下命令,查看Deepnccl是否安装成功。

      ldconfig -p | grep nccl

      如果回显结果中如下图所示,显示libnccl.so表示Deepnccl已安装成功。

      验证.png
  • CentOS操作系统

    1. 执行以下命令,下载Deepnccl的.rpm安装包。

      本步骤以下载Deepnccl 2.0.1版本为例。

      wget https://aiacc.oss-accelerate.aliyuncs.com/nccl/rpm/deep-nccl-2.0.1.rpm
    2. 执行以下命令,安装Deepnccl。

      rpm -i deep-nccl-2.0.1.rpm
    3. 执行以下命令,查看Deepnccl是否安装成功。

      ldconfig -p | grep nccl

      如果回显结果中如下图所示,显示libnccl.so表示Deepnccl已安装成功。

      验证.png

使用Deepnccl

Deepnccl(包括aiacc-nccl-plugin)安装成功后,您可以直接使用Deepnccl的通信优化功能,无需再进行其他配置。

  • 本页导读 (1)
文档反馈