Linux安装Pytorch1.8GPU(CUDA11.1)的实现

先说下自己之前的环境(都是Linux系统,差别不大):

  • Centos7.6
  • NVIDIA Driver Version 440.33.01(等会需要更新驱动)
  • CUDA10.1
  • Pytorch1.6/1.7

提示,如果想要保留之前的PyTorch1.6或1.7的环境,请不要卸载CUDA环境,可以通过Anaconda管理不同的环境,互不影响。但是需要注意你的NVIDIA驱动版本是否匹配。

在这里能够看到官方给的对应CUDA版本所需使用驱动版本。

通过上表可以发现,如果要使用CUDA11.1,那么需要将显卡的驱动更新至455.23或以上(Linux x86_64环境)。由于我之前的驱动版本是440.33.01,那么肯定不满足,所以需要更新下显卡的驱动。通过以下指令可以查看你电脑上的驱动版本:

nvidia-smi

如果你的驱动版本是满足的,那么可以直接跳到创建Pytorch1.8虚拟环境章节。

更新驱动

卸载旧驱动

我之前安装的是NVIDIA-440的版本,找到之前下载的安装程序,然后打开终端通过以下指令进行卸载:

sh ./NVIDIA-Linux-x86_64-440.33.01.run --uninstall

安装新驱动

1)下载驱动,直接去NVIDIA官网下载:https://www.nvidia.cn/Download/index.aspx?lang=cn

根据你的GPU型号以及操作信息选择对应的驱动,注意CUDA Toolkit11版的当前可选的只有11.0和11.2,而我们要装的是11.1所以选择11.2即可。

2)关闭Xserver服务 (如果没有安装桌面系统可以跳过)
我的桌面系统是gdm(GNOME Display Manager)类型的,通过systemctl可以看到:

systemctl status gdm.service

显示结果:

● gdm.service - GNOME Display Manager
Loaded: loaded (/usr/lib/systemd/system/gdm.service; enabled; vendor preset: enabled)
Active: active (running) since Fri 2021-01-22 09:27:06 CST; 1 months 22 days ago
Process: 32347 ExecStartPost=/bin/bash -c TERM=linux /usr/bin/clear > /dev/tty1 (code=exited, status=0/SUCCESS)
Main PID: 32344 (gdm)
Tasks: 22
CGroup: /system.slice/gdm.service
├─32344 /usr/sbin/gdm
└─32357 /usr/bin/X :0 -background none -noreset -audit 4 -verbose -auth /run/gdm/auth-for-gdm-mBzawN/databa...

Jan 22 09:27:06 localhost.localdomain systemd[1]: Starting GNOME Display Manager...
Jan 22 09:27:06 localhost.localdomain systemd[1]: Started GNOME Display Manager.

关闭gdm服务:

systemctl stop gdm.service

注意,如果还开启了类似VNC远程桌面的服务也要记得关闭。

3)安装新版本驱动

sh ./NVIDIA-Linux-x86_64-460.32.03.run 

4)检查nvidia服务
通过以下指令能够看到当前主机上的nvidia驱动版本以及所有可用GPU设备信息。

nvidia-smi

5)再次开启桌面服务、VNC等
如果不是gdm或者不使用桌面环境可以跳过此步骤

systemctl start gdm.service

创建PyTorch1.8虚拟环境

为了不同版本之间的环境互相隔离,强烈建议使用Anaconda的虚拟环境。其实使用起来也非常简单:

创建虚拟环境,这里我创建了一个名为torch18的虚拟环境,并且创建python3.8的编译环境。

conda create -n torch18 python=3.8

安装完成后,激活虚拟环境

conda activate torch18

接着安装点常用的包,这里直接通过requirements.txt批量安装(不需要可以跳过)

pip install -r requirements.txt

requirements.txt文件里可以是你常用的一些包,例如:

numpy==1.17.0
matplotlib==3.2.1
lxml==4.6.2
tqdm==4.42.1

如果需要退出虚拟环境,执行以下指令即可:

conda deactivate

安装PyTorch1.8

在线安装

进入PyTorch官网:https://pytorch.org/

我们通过选择自己的系统类型、安装方式以及CUDA的版本可以得到对应的安装指令。官方默认会顺带安装torchvision和torchaudio但我只需要torchvision所以通过以下指令安装 (注意,要进入对应的虚拟环境安装,例如上面的torch18环境)

pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html

安装完成后就可以使用了,不需要在单独安装CUDA,并且不会影响之前安装的CUDA版本。

下面进行简单的测试:

首先在终端输入python进入python环境:

pyhton

然后导入torch包,查看cuda是否可用:

import torch
torch.cuda.is_available()

如果打印的是True表示成功

离线安装

有些时候,可能你的设备无法连接外网,此时需要提前准备好需要安装的whl文件,那么我们这里就以torchtorchvision为例(注意安装torch前需要提前安装好numpy包)。刚刚我们在线安装时发现安装指令最后有个网址,https://download.pytorch.org/whl/torch_stable.html,没错就是官方存放所有的安装包,所以我们可以直接去那里下载。

我们在这里可以找到我们需要的torch-1.8.0+cu111-cp38-cp38-linux_x86_64.whl以及torchvision-0.9.0+cu111-cp38-cp38-linux_x86_64.whl两个文件即可。注意,cu111代表CUDA11.1,cp38表示python3.8的编译环境,linux_x86_64表示x86的平台64位操作系统。下载完成后,我们将这两个文件传入你的离线主机(服务器)中。接着在保存这两个文件夹的目录下打开终端:

进入对应虚拟环境

conda activate torch18

安装torch

pip install torch-1.8.0+cu111-cp38-cp38-linux_x86_64.whl

安装torchvison

pip install torchvision-0.9.0+cu111-cp38-cp38-linux_x86_64.whl

安装完成后进行简单的测试:

首先在终端输入python进入python环境:

pyhton

然后导入torch包,查看cuda是否可用:

import torch
torch.cuda.is_available()

如果打印的是True表示成功

通过docker安装

在有些情况下是需要使用docker来跑深度学习环境的(现在很多大公司都是使用paas平台来部署的)。那么我们就需要使用pytorch官方的docker镜像了。我们可以在docker hub上去搜索相关镜像,https://registry.hub.docker.com/。下图是我搜索的pytorch字段的结果(点击Tags后)。

我们可以看到当前最新的docker 镜像有pytorch/pytorch:1.8.0-cuda11.1-cudnn8-develpytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime,对于普通开发者下载pytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime就行了。关于安装docker的过程这里不赘述。

1)我们直接通过以下指令就能pull这个镜像了

docker pull pytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime

2)注意,在启动镜像前需要确保已安装NVIDIA Container Toolkit,否则会报错(若已安装可直接跳过此步骤):

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
  && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo

安装NVIDIA Container Toolkit,参考官方文档:https://github.com/NVIDIA/nvidia-docker
这里以Centos7为例:

首先根据你的系统类型以及版本下载对应.repo文件到/etc/yum.repos.d

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
  && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo

清空yum的过期缓存数据(如果不是root用户需要加sudo)

yum clean expire-cache

安装NVIDIA Container Toolkit(如果不是root用户需要加sudo)

yum install -y nvidia-docker2

重启docker服务(如果不是root用户需要加sudo)

systemctl restart docker

3)通过docker启动pytorch1.8.0容器

docker run --gpus all --rm -it --ipc=host pytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime

4)进入容器后可以通过nvidia-smi看到所有的GPU设备信息

5)接着进入python环境简单测试下pytorch能否正常调用GPU(打印True为成功)

import torch
torch.cuda.is_available()

到此这篇关于Linux安装Pytorch1.8GPU(CUDA11.1)的实现的文章就介绍到这了,更多相关Linux安装Pytorch GPU 内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • PyTorch 检查GPU版本是否安装成功的操作

    anaconda命令行下检查: (base) PS C:\Users\chenxuqi> conda deactivate PS C:\Users\chenxuqi> conda activate ssd (ssd) PS C:\Users\chenxuqi> python Python 3.6.12 |Anaconda, Inc.| (default, Sep 9 2020, 00:29:25) [MSC v.1916 64 bit (AMD64)] on win32 Type &qu

  • 详解anaconda离线安装pytorchGPU版

    在网速不好的情况下,如何用离线的方式安装pytorch.这里默认大家已经安装了anaconda了. 安装Nvidia驱动.cuda.cudnn等依赖 首先安装vs社区版,如果已经安装过可以跳过这一步,下载地址 安装以下两个组件即可,不用全部装上. 之后安装nvidia驱动,注意自己显卡和驱动的对应关系,下载地址 我的显卡是940M,对应如下选项: 安装cuda 这里要注意查看驱动和cuda的对应关系,首先查看自己下载的驱动文件名, 可以看到最开始有个数字,这个就是驱动版本,和cuda会有下图类似

  • Win10+GPU版Pytorch1.1安装的安装步骤

    安装cuda 更新nvidia驱动 打开GeForce Game Ready Driver或在GeForce Experience中下载符合自己gpu的程序. 选择cuda 打开nvidia控制面板 点击帮助.点击系统信息.在点击组件在3D设置中可以看到cuda信息 在我升级过nvidia驱动后,cuda的版本更新到了10.1.接下来下载cuda . cuda10.1安装完毕. 安装cuDNN 在安装了cuda10.1后选择对应的cuDNN版本v7.6.1 解压文件,然后添加bin目录到环境变量

  • 详解win10下pytorch-gpu安装以及CUDA详细安装过程

    1.Cuda的下载安装及配置 首先我们要确定本机是否有独立显卡.在计算机-管理-设备管理器-显示适配器中,查看是否有独立显卡. 可以看到本机有一个集成显卡和独立显卡NVIDIA GetForce GTX 1050. 接下来,测试本机独立显卡是否支持CUDA的安装,点击此处查询显卡是否在列表中. 从上图中,可以看到我本机的独立显卡是支持CUDA安装的,计算力是6.1. 那么,接下来就是选择CUDA进行安装即可,点击此处 这里我选了CUDA Toolkit10.0的版本,至于选择哪个版本,个人认为应

  • Win10下安装CUDA11.0+CUDNN8.0+tensorflow-gpu2.4.1+pytorch1.7.0+paddlepaddle-gpu2.0.0

    下载地址 官方下载:CUDA和CUDNN. 安装CUDA 安装之前,建议关掉360安全卫士 双击cuda_11.0.3_451.82_win10.exe文件 根据自己需要更改安装路径 将Visual Studio Integration的勾去掉 配置环境变量 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin; C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\l

  • win10使用清华源快速安装pytorch-GPU版(推荐)

    检查自己的cuda是否安装好 在anaconda prompt中输入 nvcc -V 显示如上面表示安装好了. 配置清华园下载环境 同样在在anaconda prompt中输入 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/

  • Windows10+anacond+GPU+pytorch安装详细过程

    1.查看自己电脑是否匹配GPU版本. 设备管理器查看. 查看官网是否匹配.地址:https://developer.nvidia.com/cuda-gpus  ** 2.进入NVIDIA对电脑版本进行查**看. 如果可以的的话可以自己卸载原来版本,后安装新版本.安装地址https://developer.nvidia.com/cuda-toolkit-archive 接下来,进入NVIDIA安装过程,在这安装过程中,我一开始直接选择的精简安装,但由于VS的原因,导致无法正常安装,于是我换成了自定

  • Linux安装Pytorch1.8GPU(CUDA11.1)的实现

    先说下自己之前的环境(都是Linux系统,差别不大): Centos7.6 NVIDIA Driver Version 440.33.01(等会需要更新驱动) CUDA10.1 Pytorch1.6/1.7 提示,如果想要保留之前的PyTorch1.6或1.7的环境,请不要卸载CUDA环境,可以通过Anaconda管理不同的环境,互不影响.但是需要注意你的NVIDIA驱动版本是否匹配. 在这里能够看到官方给的对应CUDA版本所需使用驱动版本. 通过上表可以发现,如果要使用CUDA11.1,那么需

  • cemtos 7 linux 安装与卸载 tomcat 7的教程

    一.声明: 本文采用操作系统版本: Centos 7 Linux系统 版本源:CentOS-7-x86_64-DVD-1708.iso 官网下载地址:http://isoredirect.centos.org/centos/7/isos/x86_64/CentOS-7-x86_64-DVD-1708.iso 安装包选择:最小安装包(且安装了 jdk,并有 vim 功能) 二.安装 tomcat 7 前的准备工作 从 apache 官网 下载 tomcat 安装包(建议使用 tar 包形式的安装文

  • 无桌面的linux安装VMWare Tools配置教程

    本文为大家分享了linux安装VMWare Tools配置教程,供大家参考,具体内容如下 1.在vmware虚拟机选项下,选择安装vmware-tools 2.将vmware安装目录下的linux.iso装载到系统中 2.1.选择需安装VMWareTools的虚拟机,右击--可移动设备--CD/DVD--设置 2.2.选择CD/DVD(SATA)--使用ISO映像文件--选文件--打钩设备状态下的"已连接"--确定 3.在系统中输入如下命令挂载:mount /dev/cdrom /mn

  • Linux安装配置php环境的方法

    本文实例讲述了Linux安装配置php环境的方法.分享给大家供大家参考,具体如下: 1.获取安装文件: http://www.php.net/downloads.php php-5.3.8.tar.gz 获取安装php需要的支持文件:http://download.csdn.net/download/netlong339/1351852 libxml2-2.6.32.tar.gz 2.安装libxml2 复制代码 代码如下: tar zxvf libxml2-2.6.32.tar.gz cd l

  • DB2个人版(Linux)安装

    正在看的db2教程是:DB2个人版(Linux)安装.DB2个人版(Linux)安装 cowboy(zizhao_chen@yahoo.com)  the fe of swust  2003-10-23 关键字:  db2 linux 安装 摘要:  本文简略的介绍了db2 pe在linux系统上的安装过程. 目录:  DB2 PE简介  或者安装文件  准备安装环境  完成安装  测试  结论  资源 DB2 PE简介 DB2 Personal Edition(DB2 PE)是在低价位的商用硬

  • Linux安装NodeJs并配合Nginx实现反向代理

    本文介绍了Linux安装NodeJs并配合Nginx实现反向代理 ,具体如下: NodeJs是什么? Node.js是一个JavaScript运行环境(runtime).实际上它是对Google V8引擎进行了封装.V8引 擎执行Javascript的速度非常快,性能非常好. Node.js对一些特殊用例进行了优化,提供了替代的API,使得V8在非浏览器环境下运行得更好. 本地安装(OS X) 版本选择 V4.4.4,长期支持版本,成熟可靠 V6.2.0 稳定版本,最新特性 这里我还是倾向于使用

  • Linux安装MySQL教程(二进制分发版)

    本教程为大家分享了Linux安装MySQL详细步骤,供大家参考,具体内容如下 第一步: 下载MySQL安装包 进入mysql官网,进入download界面,选择自己需要的版本和操作平台,我的电脑是Centos 7.我这里操作系统选择linux Generic,版本选最新.(我觉得选红帽系统应该也行,因为CentOS 本来和红帽就差不多) 你可以在windows环境下载到本地,再复制到linux目录下面,而这里我采用的是:直接在linux下使用以下指令下载 [root@hhh ~]# wget h

  • Linux安装Oracle出现乱码怎么解决

    Linux系统下Oracle经常会出现乱码,不管是安装还是使用过程中都会出现中文乱码.这是因为Linux系统中缺少了某些字体,只要安装了这些字体,就能解决这个问题了. 解决办法一: 方法如下: 把中文字体放到Oracle安装包的 jdk/jre/lib/font/fallback下就可以了. 对于使用Oracle图形化工具时出现的乱码问题: 把中文字体复制到 ~/.font下,然后执行: 复制代码 代码如下: $ sudo mkfontscale $ sudo mkfontdir 以上就是Lin

  • 图解linux安装tomcat(附常用命令)

    本例使用的是centos6.5版本,具体内容如下 一.首先到官方下载tomcat服务 http://tomcat.apache.org/download-70.cgi 二.将tomcat上传至linux服务器中 本人在根目录下建立了一个rommr文件夹 一般放到/usr/目录下,看自己了. 开始安装步骤 1.获取权限:chmod +x apache-tomcat-7.0.67.tar.gz 2.解压:tar zxvf apache-tomcat-7.0.67.tar.gz 3.重命名:mv ap

  • Linux安装MySQL5.6.24使用文字说明

    Linux安装MySQL笔记 1.在安装MySQL数据库服务器前,确保你的linux系统是可以连接网络的,下面我们将通过源码方式来安装mysql首先通过putty登入进你的Linux系统,确保系统中已经安装的gcc c++ 等编译环境,因为mysql从5.5版本开始是使用cmake编译的,如果三个环境都没安装,可以使用下面的命令进行安装:yum -y install make gcc-c++ cmake bison-devel ncurses-devel 2.查找系统里是否已经安装了mysql数

随机推荐