本文先容 如安在 Centos 7.8 操纵 体系 中禁用nouveau驱动 ,并安装Nvidia Tesla A100型号GPU的驱动,并安装CUDA11.6和cuDNN。
体系 中查察 GPU信息
体系 安装完成之后,进入体系 ,利用 lspci 下令 查询一下GPU是否存在 、型号信息是什么 。
[root@node01 ~]# lspci | grep -i nvidia
下载NVIDIA Tesla A100驱动
通过lspci查询到GPU的型号之后,访问官网nvidia.com下载驱动程序可以按照如下选择,选择产物 范例 、系列、型号 、然后根据本身 的操纵 体系 来选择。
留意 :假如 操纵 体系 是 Linux ,只管 选择Linux 32-bit/Linux 64-bit,不必要 选择具体 的Linux发行版本。测试是发现选择具体 的Linux发行版本,安装驱动之后 ,找不到nvidia-smi下令 。
安装gcc等依靠 包
当安装GPU驱动时,提示缺少相干 的依靠 包,在此,我们必要 提前安装相干 的依靠 包 ,如今 必要 用到的是gcc , g++ , make :
[root@localhost ~]# yum -y install gcc gcc-c++ kernel-devel make
屏蔽nouveau开源版本的GPU驱动
当体系 安装完成之后,会安装体系 开源的NVIDIA驱动版本,名称为nouveau。查察 nouveau驱动是否加载。
[root@localhost ~]# lsmod |grep -i nouveau
下面将屏蔽该驱动 。编辑/etc/default/grub文件 ,修改GRUB_CMDLINE_LINUX一行:
[root@localhost ~]# cat /etc/default/grub
生存 退出,更新grub:
[root@localhost ~]# grub2-mkconfig -o /boot/grub2/grub.cfg
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-3.10.0-1160.el7.x86_64
Found initrd image: /boot/initramfs-3.10.0-1160.el7.x86_64.img
Found linux image: /boot/vmlinuz-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6
Found initrd image: /boot/initramfs-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6.img
done
[root@localhost ~]# grub2-mkconfig -o /boot/grub2/grub.efi.cfg
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-3.10.0-1160.el7.x86_64
Found initrd image: /boot/initramfs-3.10.0-1160.el7.x86_64.img
Found linux image: /boot/vmlinuz-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6
Found initrd image: /boot/initramfs-0-rescue-91fd57f1c90a4a2da20ef93ed7f886c6.img
编辑/lib/modprobe.d/dist-blacklist.conf,把 blacklist nvidiafb 改成 #blacklist nvidiafb ,然后在最下面添加blacklist nouveau和。
[root@localhost ~]# vim /lib/modprobe.d/dist-blacklist.conf
# blacklist nvidiafb
blacklist nouveau
options nouveau modeset=0
备份initrams并利用 dracut重新创建 initramfs并重启体系 :
[root@localhost ~]# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
[root@localhost ~]# dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
[root@localhost ~]# reboot
查察 nouveau模块是否加载,不表现 的话就表现 已经禁用:
# lsmod | grep nouveau
安装NVIDIA GPU驱动
安装下载的GPU驱动:NVIDIA-Linux-x86_64-510.47.03.run ,如今 驱动版本为:510.47.03 ,如下实行 该驱动文件,即可安装。
[root@localhost ~]# ./NVIDIA-Linux-x86_64-346.47.run
输入nvidia-smi来查察 是否可以看到GPU信息:
[root@localhost ~]# nvidia-smi
至此安装完成 。
安装CUDA 11.6
访问nvidia官网,下载CUDA ,cuda的链接为:https://developer.nvidia.com/cuda-downloads
选择runfile文件来安装。
[root@localhost ~]# wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run
[root@localhost ~]# sudo sh cuda_11.6.0_510.39.01_linux.run
如下图,Driver选项不要勾选了,前面已经安装GPU驱动了。
创建环境 变量,编辑~/.bashrc文件:
[root@localhost ~]# vim ~/.bashrc
将下面下令 追加到文件最背面 :
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
为nvcc下令 创建一个软毗连 到/usr/bin目次 :
[root@localhost ~]# sudo ln -s /usr/local/cuda/bin/nvcc /usr/bin/nvcc
利用 nvcc下令 查察 cuda的版本:
[root@localhost ~]# nvcc --version
END
官方站点:www.linuxprobe.com
Linux下令 大全:www.linuxcool.com
(新群 ,火热加群中……)