CodLe

Keep calm and make sure the growth is my own business.

Linux 源码安装 PyTorch 小记

Codle / Oct 4, 2024


PyTorch 是一个非常强大的神经网络的框架,为了发挥其最大的效果一般都会结合 GPU 来使用。但是随着相关显卡硬件的发展,官方对于一些老型号显卡的预编译也随之取消了。如果还在使用较老的显卡型号,同时也想使用 PyTorch 的 GPU 支持,那么就需要从源码进行安装了。

本机配置

首先,这里介绍一些本机的实际环境:

安装环境

安装环境主要包含 Python 环境、显卡驱动、CUDA、cuDNN。下面将分别讲述安装的过程。

Python 环境

PyTorch 是一个 Python 下的神经网络框架,因此首先需要安装 Python 环境。对于 Python 环境,官方推荐使用 Anaconda 工具包。
首先是 Anaconda 的下载,官方下载页面:https://www.anaconda.com/download/#linux ,一般是下载 Python 3.6 版本。
下载是一个 sh 文件,使用以下命令进行安装:

sh ./Anaconda3-5.2.0-Linux-x86_64.sh

显卡驱动

显卡驱动安装是 GPU 支持中比较困难的一步。英伟达的显卡驱动分为两个版本,apt 上的非公版本和英伟达官网的版本。但从我自己的试验结果而言,英伟达的官方驱动很难安装成功,还是推荐使用 apt 来安装。

对于 Ubuntu 16.04 以上的版本,有一个比较简单的方法:

sudo ubuntu-drivers autoinstall

这是一个 Ubuntu 设备管理器,使用autoinstall可以安装所有设备的最新版本驱动,相当方便。

CUDA

CUDA 从英伟达官网下载,下载地址:https://developer.nvidia.com/cuda-downloads
选择:Linux->x86_64->Ubuntu->17.10(还没有 18.04 版本,17.10版本可以正常使用)->runfile(local)

这里下载 runfile 文件,不要下载 deb 的版本,因为 deb 版本会自动安装显卡驱动,与 apt 源里面的驱动冲突,会导致安装异常。

runfile 文件可以使用bash cuda_9.2.148_396.37_linux.run 来运行,中间大部分都可以选择默认,唯一需要注意的是询问是否安装显卡驱动时,一定要选否

安装好后,编辑~/.bashrc文件,在后面增加:

export PATH=/usr/local/cuda-9.2/bin:${PATH:+:${PATH}}
export CUDA_HOME=/usr/local/cuda-9.2
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64:${CUDNN_HOME}/lib64:$LD_LIBRARY_PATH
export CPLUS_INCLUDE_PATH=${CUDA_HOME}/include:${CUDNN_HOME}/include:$CPLUS_INCLUDE_PATH

cuDNN

cuDNN 的下载在https://developer.nvidia.com/cudnn ,需要一个英伟达账号,注册即可。

下载为 tar 包,首先是解压:

tar -xzvf cudnn-9.0-linux-x64-v7.tgz

然后链接库:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

接着在.bashrc 中添加:

export CUDNN_PATH="/usr/local/cuda/lib64/libcudnn.so.7"
export CUDNN_LIBRARY="/usr/local/cuda/lib64/libcudnn.so"
export CUDNN_INCLUDE_DIR="/usr/local/cuda/include/"
export CUDNN_LIB_DIR="/usr/local/cuda/lib64/"

安装 PyTorch

需要注意的一点

源码需要在本机上进行编译,因此需要电脑安装 GCC 和 G++。针对 GCC 的版本,PyTorch 要求 GCC 低于 7 版本,而 CUDA 9.2 要求高于 6 版本,因此推荐使用 6 版本。

安装:

sudo apt install gcc-6 g++-6 gcc-6-multilib g++-6-multilib

设置权重:

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-6 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-6 50

配置当前的 GCC、G++ 版本:

sudo update-alternatives --config gcc
sudo update-alternatives --config g++

根据提示框选择相应版本即可。

安装依赖项目

首先安装依赖:

export CMAKE_PREFIX_PATH="$(dirname $(which conda))/../" # [anaconda root directory]

conda install numpy pyyaml mkl mkl-include setuptools cmake cffi typing
conda install -c mingfeima mkldnn

conda install -c pytorch magma-cuda90 

下载源码

需要安装 Git 软件,没有安装使用sudo apt install git进行安装。
执行下面代码,将 PyTorch 拷贝下来:

git clone --recursive https://github.com/pytorch/pytorch
cd pytorch

安装

进入文件夹,安装 PyTorch。

cd pytorch
python setup.py install

大概需要等 2 个小时左右,取决于 CPU 的速度。

测试

离开 PyTorch 的源码文件夹再进行测试。

打开 IPython 环境:

ipython

输入下面代码测试 GPU 能否工作:

import torch
a = torch.LongTensor([1, 2, 3])
print(a)
a = a.cuda()
print(a)