Linux 服务器环境配置踩坑日记

Linux 服务器环境配置踩坑日记

1 下载安装 Anaconda

清华镜像站中找到想要的 anaconda 版本。

然后直接找到想要放下载文件的目录

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.1-Linux-x86_64.sh

然后安装 anaconda

bash Anaconda3-5.3.1-Linux-x86_64.sh

一路回车各种操作确认安装。

可能需要激活一下 base 环境(记得把home目录换成自己用户的)

eval "$(/home/ivy/anaconda3/bin/conda shell.bash hook)"

2 确认一下自己的显卡驱动版本和支持的CUDA

下面的命令可以查看显卡的情况,也会显示驱动版本和支持的CUDA

nvidia-smi

这里查显卡驱动和CUDA版本的对应 https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

这里查 TensorFlow, cuDNN 和 CUDA 版本的对应关系 https://tensorflow.google.cn/install/source_windows?hl=en#gpu

3 安装 PyTorch

创建一个虚拟环境来安装 PyTorch(python 版本自己随意)

conda create -n torch-gpu python=3.7
conda activate torch-gpu

根据自己的情况在官网找到安装的命令,如

conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch

安装完了。可以进入 python 环境验证一下 GPU 环境

import torch
torch.cuda.is_available()

4 安装 TensorFlow

创建一个虚拟环境来安装 TensorFlow(python 版本自己随意)

conda create -n tf-gpu python=3.7
conda activate tf-gpu

根据自己在步骤 2 找到的版本安装

pip install tensorflow_gpu==2.3.0
conda install cudatoolkit=10.1 cudnn=7.6 h5py

(踩的坑,为什么 conda install 找不到 tensorflow_gpu 的包)

然后在 python 环境测试一下

import tensorflow as tf
len(tf.config.list_physical_devices('GPU'))

Refs

[1] Installing Pytorch with GPU Support (CUDA) in Ubuntu 18.04 — Complete Guide

[2] Installing TensorFlow GPU & Enabling CUDA in Ubuntu 18.04— Complete Guide

posted @ 2021-12-09 17:43  Yingjing  阅读(99)  评论(0编辑  收藏  举报