Linux 源码安装 PyTorch 小记
Codle / Dec 5, 2024
PyTorch 是一个非常强大的神经网络的框架,为了发挥其最大的效果一般都会结合 GPU 来使用。但是随着相关显卡硬件的发展,官方对于一些老型号显卡的预编译也随之取消了。如果还在使用较老的显卡型号,同时也想使用 PyTorch 的 GPU 支持,那么就需要从源码进行安装了。
本机配置
首先,这里介绍一些本机的实际环境:
- 操作系统:Ubuntu 18.04 LTS
- Python 版本:3.6
- 笔记本型号:联想 Y50-70
- 显卡型号:GTX 860m(4G,开普勒架构版本)
- 内存:16G
安装环境
安装环境主要包含 Python 环境、显卡驱动、CUDA、cuDNN。下面将分别讲述安装的过程。
Python 环境
PyTorch 是一个 Python 下的神经网络框架,因此首先需要安装 Python 环境。对于 Python 环境,官方推荐使用 Anaconda 工具包。
首先是 Anaconda 的下载,官方下载页面:https://www.anaconda.com/download/#linux ,一般是下载 Python 3.6 版本。
下载是一个 sh 文件,使用以下命令进行安装:
sh ./Anaconda3-5.2.0-Linux-x86_64.sh
显卡驱动
显卡驱动安装是 GPU 支持中比较困难的一步。英伟达的显卡驱动分为两个版本,apt 上的非公版本和英伟达官网的版本。但从我自己的试验结果而言,英伟达的官方驱动很难安装成功,还是推荐使用 apt 来安装。
对于 Ubuntu 16.04 以上的版本,有一个比较简单的方法:
sudo ubuntu-drivers autoinstall
这是一个 Ubuntu 设备管理器,使用autoinstall
可以安装所有设备的最新版本驱动,相当方便。
CUDA
CUDA 从英伟达官网下载,下载地址:https://developer.nvidia.com/cuda-downloads
选择:Linux->x86_64->Ubuntu->17.10(还没有 18.04 版本,17.10版本可以正常使用)->runfile(local)
这里下载 runfile 文件,不要下载 deb 的版本,因为 deb 版本会自动安装显卡驱动,与 apt 源里面的驱动冲突,会导致安装异常。
runfile 文件可以使用bash cuda_9.2.148_396.37_linux.run
来运行,中间大部分都可以选择默认,唯一需要注意的是询问是否安装显卡驱动时,一定要选否。
安装好后,编辑~/.bashrc
文件,在后面增加:
export PATH=/usr/local/cuda-9.2/bin:${PATH:+:${PATH}}
export CUDA_HOME=/usr/local/cuda-9.2
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64:${CUDNN_HOME}/lib64:$LD_LIBRARY_PATH
export CPLUS_INCLUDE_PATH=${CUDA_HOME}/include:${CUDNN_HOME}/include:$CPLUS_INCLUDE_PATH
cuDNN
cuDNN 的下载在https://developer.nvidia.com/cudnn ,需要一个英伟达账号,注册即可。
下载为 tar 包,首先是解压:
tar -xzvf cudnn-9.0-linux-x64-v7.tgz
然后链接库:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
接着在.bashrc
中添加:
export CUDNN_PATH="/usr/local/cuda/lib64/libcudnn.so.7"
export CUDNN_LIBRARY="/usr/local/cuda/lib64/libcudnn.so"
export CUDNN_INCLUDE_DIR="/usr/local/cuda/include/"
export CUDNN_LIB_DIR="/usr/local/cuda/lib64/"
安装 PyTorch
需要注意的一点
源码需要在本机上进行编译,因此需要电脑安装 GCC 和 G++。针对 GCC 的版本,PyTorch 要求 GCC 低于 7 版本,而 CUDA 9.2 要求高于 6 版本,因此推荐使用 6 版本。
安装:
sudo apt install gcc-6 g++-6 gcc-6-multilib g++-6-multilib
设置权重:
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-6 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-6 50
配置当前的 GCC、G++ 版本:
sudo update-alternatives --config gcc
sudo update-alternatives --config g++
根据提示框选择相应版本即可。
安装依赖项目
首先安装依赖:
export CMAKE_PREFIX_PATH="$(dirname $(which conda))/../" # [anaconda root directory]
conda install numpy pyyaml mkl mkl-include setuptools cmake cffi typing
conda install -c mingfeima mkldnn
conda install -c pytorch magma-cuda90
下载源码
需要安装 Git 软件,没有安装使用sudo apt install git
进行安装。
执行下面代码,将 PyTorch 拷贝下来:
git clone --recursive https://github.com/pytorch/pytorch
cd pytorch
安装
进入文件夹,安装 PyTorch。
cd pytorch
python setup.py install
大概需要等 2 个小时左右,取决于 CPU 的速度。
测试
离开 PyTorch 的源码文件夹再进行测试。
打开 IPython 环境:
ipython
输入下面代码测试 GPU 能否工作:
import torch
a = torch.LongTensor([1, 2, 3])
print(a)
a = a.cuda()
print(a)