ubuntu16.0 caffe安装 - Gesündeste

1、安装深度学习所需要的依赖

　　执行下面的命令

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev 
sudo apt-get install git cmake build-essential
sudo apt-get install -y libatlas-base-dev

2、配置环境变量

　　同样使用 gedit 命令打开配置文件：

sudo gedit ~/.bashrc

　　打开后在文件最后加入以下两行内容：

export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH

2、显卡驱动程序安装，

　　由于新版本Ubuntus（> = 14.04）已内置驱动管理程序，可以通过驱动管理程序来安装显卡驱动：“系统设置” - >“软件和更新“ - >”附加驱动“。如果列表中没有相关的选项，请添加源后重试：

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update

　　打开驱动管理，如下，选择version 410.78....安装

3、安装cuda

　　从英伟达官网下载cuda10.0, 安装过程中注意不要选择安装CUDA中集成的显卡驱动和OpenGL！（当询问时选择 ”N“ ）：

chmod +x cuda_10.0.130_410.48_linux.run
sudo ./cuda_10.0.130_410.48_linux.run

　　当安装完成后，请不要忘记在 “.bashrc” 或者 “.zshrc”（在“~/”目录下，您需要使用Ctrl+H来查看隐藏文件）中配置系统环境变量：

export PATH=/usr/local/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH

使该配置生效：

source ~/.bashrc

安装完成后可用 nvcc -V 命令验证是否安装成功，若出现以下信息则表示安装成功：

✗ nvcc -V   
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130

4、安装cuDNN

　　4.1 使用deb包安装

sudo dpkg -i ./libcudnn7_7.5.1.10-1+cuda10.0_amd64.deb
sudo dpkg -i ./libcudnn7-dev_7.5.1.10-1+cuda10.0_amd64.deb
sudo dpkg -i ./libcudnn7-doc_7.5.1.10-1+cuda10.0_amd64.deb

　　4.2 压缩包安装：cudnn-10.0-linux-x64-v7.5.1.10.tgz

　　解压该压缩包，得到一个 cudnn 文件夹，该文件夹下include 和 lib64 两个文件夹，命令行进入 cudn/include 路径下，然后进行以下操作：

sudo cp cudnn.h /usr/local/cuda/include/ #复制头文件

　　然后命令行进入 cudn/lib64 路径下，运行以下命令：

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
 
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
 
sudo chmod a+r /usr/local/cuda/include/cudnn.h
 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

　　在终端输入命令：　

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

　　如果出现下图所示版本信息，说明安装成功。

#define CUDNN_MAJOR 7
#define CUDNN_MINOR 5
#define CUDNN_PATCHLEVEL 1
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

#include "driver_types.h"

5、opencv安装

　　由于装了ros系统，自动装了oepncv不需要编译安装。

6、安装OpenBLAS

　　1、先下载git，然后安装OpenBLAS

mkdir ~/git
cd ~/git
git clone https://github.com/xianyi/OpenBLAS.git
cd OpenBLAS 
sudo apt-get install gfortran
make FC=gfortran -j $(($(nproc) + 1))
sudo make PREFIX=/usr/local install

　　2、添加lib库的变量路径

echo 'export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH' >> ~/.bashrc

7、安装caffe

　　安装的路径下 clone caffe代码：

git clone https://github.com/BVLC/caffe.git

　　完成后进入caffe-master，进入 caffe ，将 Makefile.config.example 文件复制一份并更名为 Makefile.config ，执行下列命令完成复制操作：

sudo cp Makefile.config.example Makefile.config

　　复制一份的原因是编译 caffe 时需要的是 Makefile.config 文件，而Makefile.config.example 只是caffe 给出的配置文件例子，不能用来编译 caffe。

　　然后修改 Makefile.config 文件，在 caffe 目录下打开该文件：

sudo gedit Makefile.config

　　修改 Makefile.config 文件内容：

　　7.1 应用 cudnn

将
#USE_CUDNN := 1
修改成： 
USE_CUDNN := 1

　　7.2 应用 opencv 版本

将
#OPENCV_VERSION := 3 
修改为： 
OPENCV_VERSION := 3

　　7.3 使用 python 接口

将
#WITH_PYTHON_LAYER := 1 
修改为 
WITH_PYTHON_LAYER := 1

　　7.4 修改 python 路径

INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include
LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib 
修改为： 
INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/include/hdf5/serial
LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/lib/x86_64-linux-gnu /usr/lib/x86_64-linux-gnu/hdf5/serial

　　7.5 如果安装了OpenBLAS，修改BLAS参数

sed -i 's/BLAS := atlas/BLAS := open/' Makefile.config

　　7.6 修改 caffe 目录下的 Makefile 文件

将：
NVCCFLAGS +=-ccbin=$(CXX) -Xcompiler-fPIC $(COMMON_FLAGS)
替换为：
NVCCFLAGS += -D_FORCE_INLINES -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS)

　　再修改

将：
LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_hl hdf5
改为：
LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_serial_hl hdf5_serial

　　7.7 编译

　　在 caffe 目录下执行：

sudo make all -j4
sudo make distribute  (安装caffe编译生成的库到caffe/distribute，可用于开发)

7.8 编译成功后可运行测试：

sudo make runtest -j4

表示编译安装成功

8、安装 pycaffe notebook 接口环境

　成功安装 caffe 之后，就可以通过 caffe 去做训练数据集或者预测各种相关的事了，只不过需要在命令行下通过 caffe 命令进行操作，而这一步 pycaffe 的安装以及 notebook 环境配置只是为了更方便的去使用 caffe ，实际上大多数都是通过 python 来操作 caffe 的，而 notebook 使用浏览器作为界面，可以更方便的编写和执行 python 代码。

首先编译 pycaffe :

cd caffe
 
sudo make pycaffe -j4

配置notebook环境

首先要安装python接口依赖库，在caffe根目录的python文件夹下，有一个requirements.txt的清单文件，上面列出了需要的依赖库，按照这个清单安装就可以了。

在安装scipy库的时候，需要fortran编译器（gfortran)，如果没有这个编译器就会报错，因此，我们可以先安装一下。

首先进入 caffe

/python 目录下，执行安装代码：

sudo apt-get install gfortran
for req in $(cat requirements.txt); do sudo pip install $req; done

安装完成以后执行：

sudo pip install -r requirements.txt

就会看到，安装成功的，都会显示Requirement already satisfied, 没有安装成功的，会继续安装。

然后安装 jupyter ：

sudo pip install jupyter

安装完成后运行 notebook :

 jupyter notebook
 
或

ipython notebook

就会在浏览器中打开notebook。

9、安装过程遇到的坑

　　8.1、编译时，提示如下错误

nvcc fatal : Unsupported gpu architecture 'compute_20'
nvcc fatal : Unsupported gpu architecture 'compute_20'
Makefile:605: recipe for target '.build_release/cuda/src/caffe/util/math_functions.o' failed

　　原因是cuda版本不兼容，在Makefile.config 中 CUDA_ARCH 设置没有去掉不兼容的arch，根据提示：

# CUDA architecture setting: going with all of them.  
# For CUDA < 6.0, comment the *_50 through *_61 lines for compatibility.  
# For CUDA < 8.0, comment the *_60 and *_61 lines for compatibility.  
# For CUDA >= 9.0, comment the *_20 and *_21 lines for compatibility.  
CUDA_ARCH := -gencode arch=compute_20,code=sm_20 \  
                -gencode arch=compute_20,code=sm_21 \  
                -gencode arch=compute_30,code=sm_30 \  
                -gencode arch=compute_35,code=sm_35 \  
                -gencode arch=compute_50,code=sm_50 \  
                -gencode arch=compute_52,code=sm_52 \  
                -gencode arch=compute_60,code=sm_60 \  
                -gencode arch=compute_61,code=sm_61 \  
                -gencode arch=compute_61,code=compute_61

　　电脑cuda为10.0，所以需要删除

-gencode arch=compute_20,code=sm_20 \  
-gencode arch=compute_20,code=sm_21 \ 
　　之后编译成功

　　8.2、cuda库找不到

.build_release/tools/caffe
.build_release/tools/caffe: error while loading shared libraries: libcudart.so.10.0: cannot open shared object file: No such file or directory
Makefile:543: recipe for target 'runtest' failed
make: *** [runtest] Error 127

　　解决方法：

　　将相应的库文件复制到/usr/lib，终端运行如下命令：

sudo cp /usr/local/cuda-10.0/lib64/libcudart.so.10.0 /usr/local/lib/libcudart.so.10.0 && sudo ldconfig

sudo cp /usr/local/cuda-10.0/lib64/libcublas.so.10.0 /usr/local/lib/libcublas.so.10.0 && sudo ldconfig

sudo cp /usr/local/cuda-10.0/lib64/libcurand.so.10.0 /usr/local/lib/libcurand.so.10.0 && sudo ldconfig

　　ps. ldconfig命令是一个动态链接库管理命令，是为了让动态链接库为系统共享

　　8.4 编译 pycaffe时报错：fatal error: numpy/arrayobject.h没有那个文件或目录

python/caffe/_caffe.cpp:10:31: fatal error: numpy/arrayobject.h: 没有那个文件或目录

　　python2已经安装了numpy，但还是报这个错误

　　进入python2

import numpy as np
np.get_include()

　　得到：

/usr/local/lib/python2.7/dist-packages/numpy/core/include

在Makefile.config找到PYTHON_INCLUDE，发现有点不同：

PYTHON_INCLUDE := /usr/include/python2.7 \
        /usr/lib/python2.7/dist-packages/numpy/core/include

要加一个local，变成： 

PYTHON_INCLUDE := /usr/include/python2.7 \
        /usr/local/lib/python2.7/dist-packages/numpy/core/include

再make pycaffe就ok了 

　8.5 import caffe时

ImportError:No module named skimage.io

解决办法：

可能是我们没有安装所谓的skimage.io模块，所以可以用以下的命令来安装：

pip install scikit-image

关掉终端，重新进入再编译

或者：

sudo pip install scikit-image

另一种方法：

sudo apt-get install python-skimage

　　8.6 导入 caffe 时出现错误：

File "<stdin>", line 1, in <module>   ImportError: No module named caffe

解决方法：

zsh则

sudo echo export PYTHON=/home/.../caffe/python:$PYTHONPATH >> ~/.zshrc

source ~/.zshrc

　　在python2中导入caffe

　　8.7 python3使用caffe

raceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/wyl/caffe/python/caffe/__init__.py", line 1, in <module>
    from .pycaffe import Net, SGDSolver, NesterovSolver, AdaGradSolver, RMSPropSolver, AdaDeltaSolver, AdamSolver, NCCL, Timer
  File "/home/wyl/caffe/python/caffe/pycaffe.py", line 13, in <module>
    from ._caffe import Net, SGDSolver, NesterovSolver, AdaGradSolver, \
ImportError: dynamic module does not define module export function (PyInit__caffe)

报这个错，说明当前我的python版本太高，可以看到我用的是3.6版本，降低python版本。

具体降低python版本，用python虚拟环境搭建中的虚拟python环境方法。

命令是：mkvirtualenv -p /usr/bin/python2 环境名称

export PYTHON=/home/.../caffe/python:$PYTHONPATH

8.8 编译是找不到opencv库

connot find -lopencv_imgcodecs .......

或者

.build_release/lib/libcaffe.so: undefined reference to `cv::imread(cv::String const&, int)'
.build_release/lib/libcaffe.so: undefined reference to `cv::imencode(cv::String const&, cv::_InputArray const&, std::vector<unsigned char, std::allocator<unsigned char> >&, std::vector<int, std::allocator<int> > const&)' ....

解决方法

先修改Makefile.config文件中

1、修改USE_OPENCV := 1

# uncomment to disable IO dependencies and corresponding data layers
USE_OPENCV := 1

2、OPENCV_VERSION := 3 注释掉（实际测试中不注释掉也能编译）

# Uncomment if you're using OpenCV 3
OPENCV_VERSION := 3

3、打开USE_PKG_CONFIG

# Uncomment to use `pkg-config` to specify OpenCV library paths.
# (Usually not necessary -- OpenCV libraries are normally installed in one of the above $LIBRARY_DIRS.)
USE_PKG_CONFIG := 1

然后在caffe根目录下，找到Makefile文件，打开文件

因为lib文件opencv_imgcodecs在Makefile文件中未添加，修改如下：

LIBRARIES += glog gflags protobuf leveldb snappy \
    lmdb boost_system hdf5_hl hdf5 m \
    opencv_core opencv_highgui opencv_imgproc opencv_imgcodecs

此外，还有一些Makefile文件这么写，也是可行的：

ifeq ($(USE_OPENCV), 1)
    LIBRARIES += opencv_core opencv_highgui opencv_imgproc 

    ifeq ($(OPENCV_VERSION), 3)
        LIBRARIES += opencv_imgcodecs
    endif

endif

再在caffe目录下，sudo make all -j8一下，问题解决

posted on 2019-06-21 10:25 Gesündeste 阅读(513) 评论(0) 编辑收藏举报

刷新页面返回顶部