Ubuntu16安装CUDA(9.1)和cuDNN的实现步骤(图文)

目录
  • 本篇概览
  • 特别问题说明
  • 准备工作
  • 下载和安装Nvidia驱动
  • 安装CUDA
  • 安装cuDNN

本篇概览

自己有一台2015年的联想笔记本,显卡是GTX950M,已安装ubuntu 16.04 LTS桌面版,为了使用其GPU完成deeplearning4j的训练工作,自己动手安装了CUDA和cuDNN,在此将整个过程记录下来,以备将来参考,整个安装过程分为以下几步:

  • 准备工作
  • 安装Nvidia驱动
  • 安装CUDA
  • 安装cuDNN

特别问题说明

  • 按照一般步骤,在安装完Nvidia显卡驱动后,会提示对应的CUDA版本,接下来按照提示的版本安装CUDA,例如我这里提示的是11.2,正常情况下,我应该安装11.2版本的CUDA
  • 但是我选择9.1版本就行安装,因为之前的开发中发现deeplearning4j使用了11.2的SDK后,启动应用会有ClassNotFound的错误,此问题至今未修复(惭愧,欣宸水平如此之低…),因此,我在Nvidia驱动提示11.2版本的情况下,依然安装了9.1版本,后来在此环境运行deeplearning4j应用一切正常
  • 如果您没有我这类问题,完全可以按照驱动指定的版本来安装CUDA,具体的操作步骤稍后会详细说到;

准备工作

  • 接下来的操作,除了在网页下载,其余都是ssh远程连接到ubuntu机器操作的,ssh登录的帐号为普通帐号,并非root
  • 如果已有驱动,请先删除
sudo apt-get remove --purge nvidia*

禁用nouveau驱动(很重要),用vi打开文件/etc/modprobe.d/blacklist.conf,在尾部增加以下内容,然后保存退出:

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

关闭nouveau:

echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

更新initramfs:

update-initramfs -u

执行reboot重启电脑

重启后,执行以下命令,应该不会有任何输出,证明nouveau已经禁用:

lsmod|grep nouveau

获取Kernel source:

sudo apt-get install linux-source

安装过程中显示信息如下图:

根据上图红框中的信息,可知内核版本号为,于是执行以下命令:

sudo apt-get install linux-headers-4.4.0-210-generic

下载和安装Nvidia驱动

访问Nvidia网站,地址https://www.nvidia.cn/Download/index.aspx?lang=cn,然后选择对应的显卡和操作系统,我的选择如下图所示:

点击上图搜索按钮后,进入下图页面,点击下载:

下载得到的文件名为NVIDIA-Linux-x86_64-460.84.run

关闭图形页面:

sudo service lightdm stop

给驱动文件增加可执行权限:

sudo chmod a+x NVIDIA-Linux-x86_64-460.84.run

开始安装:

sudo ./NVIDIA-Linux-x86_64-460.84.run -no-x-check -no-nouveau-check -no-opengl-files

遇到下图,选择红框:

遇到下图,直接回车:

恢复图形页面:

sudo service lightdm start

执行命令nvidia-smi,如果驱动安装成功,会显示以下内容:

will@lenovo:~/temp/202106/20$ nvidia-smi
Sun Jun 20 09:02:11 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.84       Driver Version: 460.84       CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce GTX 950M    Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   41C    P0    N/A /  N/A |      0MiB /  4046MiB |      1%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

从上述内容可见CUDA Version: 11.2表示该驱动对应的CUDA版本应该是11.2,正如前面所说,我这边遇到了问题,因此接下来会安装9.1版本,但是您可以选择安装11.2

安装CUDA

浏览器访问https://developer.nvidia.com/cuda-toolkit-archive,点击红框中的链接:

如下图,下载Linux版本:

继续选择x86_64:

选择具体的Linux版本及其版本号:

要下载的东西不少,一个安装程序和三个补丁:

上述四个文件的下载地址整理如下:

https://developer.download.nvidia.cn/compute/cuda/9.1/secure/Prod/local_installers/cuda_9.1.85_387.26_linux.run?P0Ntu_6NLtuuEMm6fJRk1W5vl4KM7oaT1oFW870zKJ-zDw2ckKntFLOE6klRJfw2CmTa8z3Q390_6urlgc6LqjoqlIFW9gvfvDCusnINYplLaw1u8lRY8R4oVNtpNzaXU4BQcHjvdb6c6rjq20dktCcRd4640woXt1yHmD95v1Du7wdBBXq2eOY

https://developer.download.nvidia.cn/compute/cuda/9.1/secure/Prod/patches/1/cuda_9.1.85.1_linux.run?yeXf_7wIGlHAUw--E_YVLQZRgXv0x2i043woJVY-ydXU5Kyhc-eYQf5JmL-4mvYmlvPYCEc5RhT2sDWscX20CJbdOwpkt30kWb9vx8E4oIlajDQ3MVPvXdiKKsIOBUx-h0q0N0jSkNn80VMhW-nk8jwvRY_e6MuFzqWBaPk

https://developer.download.nvidia.cn/compute/cuda/9.1/secure/Prod/patches/2/cuda_9.1.85.2_linux.run?5jGZxNigaOJkaaPbMagjhSW7ebQvYGyYoqe2vBxZ1eV8qp2BzXJLxIPgAo11UgWhORirQkdJGq5b8eFh4aShBVUTmuPaasvRiMCKDZw5yjjIobGQrCEyU-LFO59AbrRER57Mxa0T1Sc97fC80IOZq8Ox2repjn7A3oYVgd8

https://developer.download.nvidia.cn/compute/cuda/9.1/secure/Prod/patches/3/cuda_9.1.85.3_linux.run?CxWimJTC-XROYihig-UZmH62odbJInf1fmxTZ_bsW1nQ0Zz5cL5r8qLmlMR_1j2rVhk3j8Z5lS6dpArt8frjGHH2MeVn5TefMoclam8udm-RSMMmqHXYE66hHN2D0drVEdtCwe8ZrEIYb2rpucaz9svCFE8Z319mge4Ju94

下载完毕后,执行命令chmod a+x *.run为上述四个文件增加可执行权限

安装CUDA:

sudo sh cuda_9.1.85_387.26_linux.run

遇到license时,像是用vi工具那样,输入":",再输入"q"回车,就能跳过license阅读,执行真正的安装操作了:

接下来是一系列提问,每一个提问的回答如下图,千万注意红框中的问题一定要选择n

安装完成后输出以下内容:

Installing the CUDA Toolkit in /usr/local/cuda-9.1 ...
Missing recommended library: libGLU.so
Missing recommended library: libX11.so
Missing recommended library: libXi.so
Missing recommended library: libXmu.so
Missing recommended library: libGL.so

Installing the CUDA Samples in /home/will ...
Copying samples to /home/will/NVIDIA_CUDA-9.1_Samples now...
Finished copying samples.

===========
= Summary =
===========

Driver:   Not Selected
Toolkit:  Installed in /usr/local/cuda-9.1
Samples:  Installed in /home/will, but missing recommended libraries

Please make sure that
 -   PATH includes /usr/local/cuda-9.1/bin
 -   LD_LIBRARY_PATH includes /usr/local/cuda-9.1/lib64, or, add /usr/local/cuda-9.1/lib64 to /etc/ld.so.conf and run ldconfig as root

To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-9.1/bin

Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-9.1/doc/pdf for detailed information on setting up CUDA.

***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 9.1 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
    sudo <CudaInstaller>.run -silent -driver

Logfile is /tmp/cuda_install_13425.log

打开文件~/.bashrc,在尾部增加以下两行(LD_LIBRARY_PATH如果已经存在,请参考PATH的写法改成追加):

export PATH=/usr/local/cuda-9.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64

执行命令source ~/.bashrc使配置生效

执行命令su -切换到root帐号,执行以下命令(不要用sudo,而是切到root帐号):

sudo echo "/usr/local/cuda-9.1/lib64" >> /etc/ld.so.conf

再以root身份执行以下命令:

ldconfig

执行命令exit退出root身份,现在又是普通帐号的身份了

执行命令nvcc -V检查CUDA版本,注意参数V是大写:

will@lenovo:~$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85

安装第一个补丁:

sudo sh cuda_9.1.85.1_linux.run

安装第二个补丁:

sudo sh cuda_9.1.85_387.26_linux.run

安装第三个补丁:

sudo sh cuda_9.1.85_387.26_linux.run

安装cuDNN

浏览器访问https://developer.nvidia.com/zh-cn/cudnn

按提示登录,如果没有帐号请注册一个,登录后进入下载页面,需要点击下图红框位置才有能见到老版本:

选择与CUDA匹配的版本:

下载后解压,得到文件夹cuda,然后执行以下命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

执行检查确认的命令cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2,如果安装顺利会有以下输出:

#define CUDNN_MAJOR 7
#define CUDNN_MINOR 1
#define CUDNN_PATCHLEVEL 3
--
#define CUDNN_VERSION    (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

#include "driver_types.h"

至此,Ubuntu16安装CUDA(9.1)和cuDNN已经完成了,希望能给您一些参考。

到此这篇关于Ubuntu16安装CUDA(9.1)和cuDNN的实现步骤(图文)的文章就介绍到这了,更多相关Ubuntu16安装CUDA(9.1)和cuDNN内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 详解Ubuntu16.04安装nvidia驱动+CUDA+cuDNN的教程

    准备工作 1.查看GPU是否支持CUDA lspci | grep -i nvidia 2.查看Linux版本 uname -m && cat /etc/*release nvidia驱动 1. 先卸载原有N卡驱动 #for case1: original driver installed by apt-get: sudo apt-get remove --purge nvidia* #for case2: original driver installed by runfile: sud

  • Ubuntu16安装CUDA(9.1)和cuDNN的实现步骤(图文)

    目录 本篇概览 特别问题说明 准备工作 下载和安装Nvidia驱动 安装CUDA 安装cuDNN 本篇概览 自己有一台2015年的联想笔记本,显卡是GTX950M,已安装ubuntu 16.04 LTS桌面版,为了使用其GPU完成deeplearning4j的训练工作,自己动手安装了CUDA和cuDNN,在此将整个过程记录下来,以备将来参考,整个安装过程分为以下几步: 准备工作 安装Nvidia驱动 安装CUDA 安装cuDNN 特别问题说明 按照一般步骤,在安装完Nvidia显卡驱动后,会提示

  • PyTorch CUDA环境配置及安装的步骤(图文教程)

    Pytorch版本介绍 torch:1.6 CUDA:10.2 cuDNN:8.1.0 ✨安装 NVIDIA 显卡驱动程序 一般 电脑出厂/装完系统 会自动安装显卡驱动 如果有 可直接进行下一步 下载链接 http://www.nvidia.cn/Download/index.aspx?lang=cn 选择和自己显卡相匹配的显卡驱动 下载安装 ✨确认项目所需torch版本 # pip install -r requirements.txt # base ---------------------

  • Ubuntu16安装Tomcat8.5和MySQL5.7的教程

    Ubuntu16由于软件源做的很好,所以这些东西安装起来很方便. Tomcat 官网:http://tomcat.apache.org/download-80.cgi 我下载的是zip版本的,直接移动至/usr/路径下边使用unzip命令解压,cd 到目录下的bin目录了. 这个时候这里的所有.sh和.bat的文件都是没有运行权限的,我们需要为.sh文件加上运行权限. sudo chmod +x *.sh 执行完成之后再ll一下,就可以看到.sh文件都有了运行的权限. 开启tomcat sudo

  • Ubuntu16.04 LTS 下安装 Android Studio 2.2.2 的详细步骤

    下载 Android SDK,官网:www.android.com我相信很多人跟我一样,进不去.Android Studio 中文官网 www.android-studio.org 进去下载, 在终端解压到想安装SDK的目录(设SDK目录为 $ASDK_HOME )即安装完成. 进入目录 $ASDK_HOME/tools/,终端运行命令 ./android 进入 SDK Manager. 通过这个软件,可以选择下载相关的开发包,有不同版本的 SDK 及其源码文档等,注意:必须下载 Extras

  • Ubuntu16安装Python3.9的实现步骤

    我是使用源码编译的方式安装的,网上有的可以添加 ppa 源进行在线安装,但我试了行不通,所以还是采用源码安装 1.安装编译依赖项 sudo apt install -y wget build-essential libreadline-dev libncursesw5-dev libssl-dev libsqlite3-dev tk-dev libgdbm-dev libc6-dev libbz2-dev libffi-dev zlib1g-dev 有的博文说在这一步需要升级pip,但我认为没必

  • Ubuntu20.04安装cuda10.1的步骤(图文教程)

    安装前准备 CUDA的主要用途是深度学习,而目前主流的深度学习框架Tensorflow2最高支持CUDA 10.1,因此本文讲解在Ubuntu 20.04系统上安装CUDA 10.1的主要过程. 首先要查看你的NVIDIA显卡驱动是否支持cuda10.1版本. 在终端执行以下命令: nvidia-smi 如果 CUDA Version: - 这里的版本号大于等于10.1(我的是10.2),就可以安装cuda10.1. 关键点:gcc降级 因为Ubuntu20.04自带的gcc版本为9.3,而cu

  • vmware12中安装 RedHat RHEL7.2系统的详细步骤(图文)

    本文介绍了vmware12中安装 RedHat RHEL7.2系统的详细步骤(图文),分享给大家,具体如下: 一.开始安装 1)新建虚拟机 RHEL7.2 2)成功引导系统--开机出现此画面 Install Red Hat EnterpriseLinux 7.2 安装RHLE7.2 操作系统 Test this edia & install RedHat Enterprise Linux 7.2 测试安装文件并安装RHLE7.2 操作系统 Troubleshooting 修复故障 3)选择第一项

  • Microsoft Sql server2005的安装步骤图文详解及常见问题解决方案

    一:安装sql server 2005过程中出现如下问题:"选择的功能中没有任何功能可以安装或升级": 解决方案:Microsoft SQL Server 2005→配置工具→SQL配置管理器→SQL Server 2005服务→右边的两个服务启动SQL Server FullTest Search() 和服务SQl Sever(计算机名) 二:无法将数CLSID写入\Software\Classes\PROTOCOLS\Handler\ms-help. 解决办法:退出电脑安全软件 三

  • win10环境下python3.5安装步骤图文教程

    点我去Python官网下载 往下翻几页就能看到各种版本的Python,当前最新的是Python3.6,也没多大区别,我选择的是3.5.2 64位的,点击download 根据自己的电脑配置,我选择的是64位的 一路默认下去吧! 安装成功!下面打开命令提示符,输入python,回车如下图一样就安装成功啦! 以上所述是小编给大家介绍的win10环境下python3.5安装步骤图文教程,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的.在此也非常感谢大家对我们网站的支持!

  • MongoDB 3.4 安装以 Windows 服务方式运行的详细步骤

    1.首先从https://www.mongodb.com/download-center#community 下载社区版,企业版也是类似. 2.双击运行安装,可自定义安装路径,这里采用默认路径(C:\Program Files\MongoDB\Server\3.4) 一路下一步直至安装完毕. 3.创建数据存放目录(这里我放在D:\MongoDB\data). D:\MongoDB\data创建db目录和log目录,分别用来存放数据库文件和日志文件. 4.创建配置文件mongod.cfg存放在D:

随机推荐