Deepnccl是为阿里云神龙异构产品开发的用于多GPU互联的AI通信加速库,能够无感地加速基于NCCL通信算子调用的分布式训练或多卡推理等任务。本文主要介绍在Ubuntu或CentOS操作系统的GPU实例上安装和使用Deepnccl的操作方法。
前提条件
已创建阿里云GPU实例,且GPU实例的操作系统为Ubuntu或CentOS。
安装Deepnccl
根据GPU实例的不同操作系统,安装Deepnccl有所不同,具体操作如下所示:
说明
安装Deepnccl时,系统会自动同时安装aiacc-nccl-plugin,确保了Deepnccl的正常使用。
Ubuntu操作系统
执行以下命令,下载Deepnccl的
.deb
安装包。本步骤以下载Deepnccl 2.0.1版本为例。
wget https://aiacc.oss-accelerate.aliyuncs.com/nccl/deb/deep-nccl-2.0.1.deb
执行以下命令,安装Deepnccl。
dpkg -i deep-nccl-2.0.1.deb
执行以下命令,查看Deepnccl是否安装成功。
ldconfig -p | grep nccl
如果回显结果中如下图所示,显示
libnccl.so
表示Deepnccl已安装成功。
CentOS操作系统
执行以下命令,下载Deepnccl的
.rpm
安装包。本步骤以下载Deepnccl 2.0.1版本为例。
wget https://aiacc.oss-accelerate.aliyuncs.com/nccl/rpm/deep-nccl-2.0.1.rpm
执行以下命令,安装Deepnccl。
rpm -i deep-nccl-2.0.1.rpm
执行以下命令,查看Deepnccl是否安装成功。
ldconfig -p | grep nccl
如果回显结果中如下图所示,显示
libnccl.so
表示Deepnccl已安装成功。
使用Deepnccl
Deepnccl(包括aiacc-nccl-plugin)安装成功后,您可以直接使用Deepnccl的通信优化功能,无需再进行其他配置。
反馈
- 本页导读 (1)
文档反馈