gpu服务器英伟达(gpu服务器显卡)〔英伟达服务器cpu〕

本文先容 如安在 Centos 7.8 操纵 体系 中禁用nouveau驱动 ,并安装Nvidia Tesla A100型号GPU的驱动,并安装CUDA11.6和cuDNN。

体系 中查察 GPU信息

体系 安装完成之后,进入体系 ,利用 lspci 下令 查询一下GPU是否存在 、型号信息是什么

[root@node01 ~]# lspci | grep -i nvidia

下载NVIDIA Tesla A100驱动

通过lspci查询到GPU的型号之后,访问官网nvidia.com下载驱动程序可以按照如下选择,选择产物 范例 、系列、型号 、然后根据本身 的操纵 体系 来选择。

留意 :假如 操纵 体系 是 Linux ,只管 选择Linux 32-bit/Linux 64-bit,不必要 选择具体 的Linux发行版本。测试是发现选择具体 的Linux发行版本,安装驱动之后 ,找不到nvidia-smi下令 。

安装gcc等依靠 包

当安装GPU驱动时,提示缺少相干 的依靠 包,在此,我们必要 提前安装相干 的依靠 包 ,如今 必要 用到的是gcc , g++ , make :

[root@localhost ~]# yum -y install gcc gcc-c++ kernel-devel make

屏蔽nouveau开源版本的GPU驱动

当体系 安装完成之后,会安装体系 开源的NVIDIA驱动版本,名称为nouveau。查察 nouveau驱动是否加载。

[root@localhost ~]# lsmod |grep -i nouveau

下面将屏蔽该驱动 。编辑/etc/default/grub文件 ,修改GRUB_CMDLINE_LINUX一行:

[root@localhost ~]# cat /etc/default/grub

生存 退出,更新grub:

[root@localhost ~]# grub2-mkconfig -o /boot/grub2/grub.cfg

Generating grub configuration file ...

Found linux image: /boot/vmlinuz-3.10.0-1160.el7.x86_64

Found initrd image: /boot/initramfs-3.10.0-1160.el7.x86_64.img

Found linux image: /boot/vmlinuz-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6

Found initrd image: /boot/initramfs-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6.img

done

[root@localhost ~]# grub2-mkconfig -o /boot/grub2/grub.efi.cfg

Generating grub configuration file ...

Found linux image: /boot/vmlinuz-3.10.0-1160.el7.x86_64

Found initrd image: /boot/initramfs-3.10.0-1160.el7.x86_64.img

Found linux image: /boot/vmlinuz-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6

Found initrd image: /boot/initramfs-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6.img

编辑/lib/modprobe.d/dist-blacklist.conf,把 blacklist nvidiafb 改成 #blacklist nvidiafb ,然后在最下面添加blacklist nouveau和。

[root@localhost ~]# vim /lib/modprobe.d/dist-blacklist.conf

# blacklist nvidiafb

blacklist nouveau

options nouveau modeset=0

备份initrams并利用 dracut重新创建 initramfs并重启体系 :

[root@localhost ~]# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

[root@localhost ~]# dracut -v /boot/initramfs-$(uname -r).img $(uname -r)

[root@localhost ~]# reboot

查察 nouveau模块是否加载,不表现 的话就表现 已经禁用:

# lsmod | grep nouveau

安装NVIDIA GPU驱动

gpu服务器英伟达(gpu服务器显卡) gpu服务器英伟达(gpu服务器显卡)〔英伟达服务器cpu〕 新闻资讯

安装下载的GPU驱动:NVIDIA-Linux-x86_64-510.47.03.run ,如今 驱动版本为:510.47.03 ,如下实行 该驱动文件,即可安装。

[root@localhost ~]# ./NVIDIA-Linux-x86_64-346.47.run

输入nvidia-smi来查察 是否可以看到GPU信息:

[root@localhost ~]# nvidia-smi

至此安装完成 。

安装CUDA 11.6

访问nvidia官网,下载CUDA ,cuda的链接为:https://developer.nvidia.com/cuda-downloads

选择runfile文件来安装。

[root@localhost ~]# wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run

[root@localhost ~]# sudo sh cuda_11.6.0_510.39.01_linux.run

如下图,Driver选项不要勾选了,前面已经安装GPU驱动了。

创建环境 变量,编辑~/.bashrc文件:

[root@localhost ~]# vim ~/.bashrc

将下面下令 追加到文件最背面 :

export CUDA_HOME=/usr/local/cuda

export PATH=$PATH:$CUDA_HOME/bin

export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

为nvcc下令 创建一个软毗连 到/usr/bin目次 :

[root@localhost ~]# sudo ln -s /usr/local/cuda/bin/nvcc /usr/bin/nvcc

gpu服务器英伟达(gpu服务器显卡) gpu服务器英伟达(gpu服务器显卡)〔英伟达服务器cpu〕 新闻资讯

利用 nvcc下令 查察 cuda的版本:

[root@localhost ~]# nvcc --version

END

官方站点:www.linuxprobe.com

Linux下令 大全:www.linuxcool.com

(新群 ,火热加群中……)