手把手教你在服务器上用YOLOv4训练和测试数据集（保姆级）转载

如果希望先训练PASCAL VOC数据集，可以按顺序阅读，如果想直接训练自己的数据集，可以先看编译darknet部分，然后直接跳到训练自己的数据集部分。

yolov4出来有一段时间了，我也用yolov4训练了自己的数据集，效果还是非常不错的。本文记录了用yolov4训练并测试PASCAL VOC和自己制作的数据集的方法，并且记录了如何将weights文件转换为移植到安卓端需要用到的tflite文件。
yolov4的paper: YOLOv4
yolov4的代码地址: darknet

参考博文：基于Darknet深度学习框架训练YoloV4模型，并用自己的模型批量处理图片并保存在文件夹内
系统环境：
GeForce GTX 1080 Ti
CUDA 9.1
Cudnn 7.1.3
Python 3.6.7
因为服务器和本机的图形界面交互没做好，所以没有用OpenCV。
（2020-7-9更正：服务器和本机的图形交互用xmanger就好啦，然后编译时就可以令OPENCV=1）

编译darknet
打开darknet-master/Makefile，如果没有下载darknet，命令行输入：

git clone https://github.com/AlexeyAB/darknet.git
1
为了方便我把原先的darknet-master文件夹重命名为darknet，在darknet下找到Makefile文件，并修改Makefile：

GPU=1
CUDNN=1
CUDNN_HALF=1
OPENCV=0
AVX=0
OPENMP=0
LIBSO=0
1
2
3
4
5
6
7
然后命令行输入：

cd darknet
make
1
2
编译完成后输入./darknet，如果出现usage:./darknet<fuction>说明编译成功。
可以用作者训练好的权值文件yolov4.weights测试一下(下载速度太慢可私信邮箱)，下载后放在darknet目录下，在命令行输入：

./darknet detect cfg/yolov4.cfg yolov4.weights data/horses.jpg
1
因为没有用OpenCV，所以检测结果没有直接显示，而是保存为darknet/predictons.jpg，看一下检测效果：

训练PASCAL VOC2007数据集
作者在github上给的是训练PASCAL VOC2007+2012案例，因为我只下载了VOC2007的数据集，所以介绍只训练VOC2007的方法，其实方法都差不多。

准备预训练模型和数据集
首先要下载预训练模型yolov4.conv.137(下载速度太慢可私信邮箱)，并放在darknet目录下，将VOC2007数据集放在darknet/data/voc/VOCdevkit目录下。

生成darknet需要的label文件
将darknet/scripts目录下的voc_label.py文件复制到darknet/data/voc目录下：cp scripts/voc_label.py data/voc/，并修改voc_label.py文件。
将开头改为：

# sets=[('2012', 'train'), ('2012', 'val'), ('2007', 'train'), ('2007', 'val'), ('2007', 'test')]
sets = [('2007', 'train'),('2007', 'val'),('2007', 'test')]
1
2
最后两行改为：

# os.system("cat 2007_train.txt 2007_val.txt 2012_train.txt 2012_val.txt > train.txt")
# os.system("cat 2007_train.txt 2007_val.txt 2007_test.txt 2012_train.txt 2012_val.txt > train.all.txt")
os.system("cat 2007_train.txt 2007_val.txt > train.txt")
os.system("cat 2007_train.txt 2007_val.txt 2007_test.txt > train.all.txt")
1
2
3
4
修改完成后运行：

cd data/voc
python voc_label.py
1
2
运行结果产生五个文件2007_train.txt, 2007_test.txt, 2007_val.txt, train.all.txt, train.txt。

修改几个配置文件
1.cfg/voc.data

classes= 20
train = /home/zmh/darknet/data/voc/train.txt # 修改为训练集路径
valid = /home/zmh/darknet/data/voc/2007_test.txt # 修改为测试集路径
names = data/voc.names # 类别名称文件
backup = backup # 模型保存文件夹
1
2
3
4
5
2.cfg/yolo-obj.cfg
将cfg/yolov4-custom.cfg复制，并将复制后的文件命名为yolo-obj.cfg：

cd cfg
cp yolov4-custom.cfg yolo-obj.cfg
1
2
修改yolo-obj.cfg:
第1处

[net]
#Testing
#batch=1
#subdivisions=1
#Training
batch=64
subdivisions=16 # 如果训练时出现out of memory，可以修改为32或者64
width=608 # 修改为416
height=608 # 修改为416
channels=3
1
2
3
4
5
6
7
8
9
10
第2处

learning_rate=0.001
burn_in=1000
max_batches = 500500 # 修改为(类别数*2000)
policy=steps
steps=400000,450000 # 修改为0.8*max_batches，0.9*max_batches
scales=.1,.1
1
2
3
4
5
6
第3、4、5处
ctrl+f查找yolo，一共有三处，修改三处yolo上面的filters，以及yolo下面的classes：

[convolutional]
size=1
stride=1
pad=1
filters=255 # 修改为(类别数+5)*3
activation=linear

[yolo]
mask = 0,1,2
anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
classes=80 # 修改为类别数，20
num=9
1
2
3
4
5
6
7
8
9
10
11
12
13
训练
./darknet detector train cfg/voc.data cfg/yolo-obj.cfg yolov4.conv.137
1
训练得到的权值文件保存在darknet/backup中。
训练是默认用第0块显卡，如果要指定第x块显卡，可以：

./darknet detector train cfg/voc.data cfg/yolo-obj.cfg yolov4.conv.137 -i x
1
如果要使用多GPU训练，可以先使用一个GPU训练得到1000次的权值文件yolo-obj_1000.weights，然后停止训练，接着使用多GPU训练（最多四块）：

./darknet detector train cfg/voc.data cfg/yolo-obj.cfg yolov-obj_1000.weights -gpus 0,1,2,3
1
如果要保存log文件：

# tee后面是log文件名字，自己设置
./darknet detector train cfg/voc.data cfg/yolo-obj.cfg yolov4.conv.137 | tee yolo_train.log
1
2
在使用OPENCV的情况下，如果要画mAp曲线：

./darknet detector train cfg/voc.data cfg/yolo-obj.cfg yolov4.conv.137 -map
1
段错误
如果训练时出现段错误：
mosaic=1 -compile Darknet with OpenCV for using mosaic=1
free(): corrupted unsorted chunks

作者有给解决方法：

因为我没有用OpenCV，所以要将cfg/yolo-obj.cfg中的mosaic设置为0。

测试
测试图片：

./darknet detector test cfg/voc.data cfg/yolo-obj.cfg backup/yolo-obj_8000.weights data/person.jpg
1
测试视频（需要OpenCV）：

./darknet detector demo cfg/voc.data cfg/yolo-obj.cfg backup/yolo-obj_8000.weights test.mp4 -out_filename output.mp4
1
FPS很小的话，加一个-dont_show或者最小化xmanger就行了。
训练了8000次的检测效果：

训练自己的数据集
完成了VOC2007的训练和测试过程，离训练自己的数据集只有一步之遥了，为了方便处理，我把自己的数据集整理成PASCAL VOC的格式，具体过程见轻松自制PASCAL VOC数据集。
假设自己的数据集已经被制作成了PASCAL VOC格式了，并且命名为VOC 2007。如果还没有下载预训练模型yolov4.conv.137(下载速度太慢可私信邮箱)，需要先下载，下载完成放在darknet目录下，并将自己的数据集(VOC 2007)放在darknet/data/voc/VOCdevkit目录下。接下来进行以下几个跟训练PASCAL VOC数据集类似的操作（我的数据集只有两个类别：green light和red light）：
1.生成darknet需要的label文件
如果之前已经修改过voc_label.py文件了，重新python voc_label.py就行了，然后会生成五个新的文件：2007_train.txt, 2007_test.txt, 2007_val.txt, train.all.txt, train.txt。
如果之前没有训练过PASCAL VOC数据集，将darknet/scripts目录下的voc_label.py文件复制到darknet/data/voc目录下：cp scripts/voc_label.py data/voc/，并修改voc_label.py文件。
将开头改为：

# sets=[('2012', 'train'), ('2012', 'val'), ('2007', 'train'), ('2007', 'val'), ('2007', 'test')]
sets = [('2007', 'train'),('2007', 'val'),('2007', 'test')]

classes = ["green light", "red light"] # 修改为自己的类别
1
2
3
4
最后两行改为：

cd data/voc
python voc_label.py
1
2
同样的，会生成五个新的文件：2007_train.txt, 2007_test.txt, 2007_val.txt, train.all.txt, train.txt。
2.修改voc.data文件
如果训练过PASCAL VOC，只要修改其中的classes。否则根据注释修改：

classes= 2 # 改为自己数据集的类别数
train = /home/zmh/darknet/data/voc/train.txt # 修改为训练集路径
valid = /home/zmh/darknet/data/voc/2007_test.txt # 修改为测试集路径
names = data/voc.names # 类别名称文件，下面会讲怎么修改里面的内容
backup = backup # 模型保存文件夹
1
2
3
4
5
3.修改cfg/yolo-obj.cfg文件
如果没有训练过PASCAL VOC，需要将cfg/yolov4-custom.cfg复制，并将复制后的文件命名为yolo-obj.cfg：

cd cfg
cp yolov4-custom.cfg yolo-obj.cfg
1
2
然后修改yolo-obj.cfg:
第1处，如果训练过PASCAL VOC，可不用修改：

learning_rate=0.001
burn_in=1000
max_batches = 4000 # 修改为(类别数*2000)
policy=steps
steps=3200,3600 # 修改为0.8*max_batches，0.9*max_batches
scales=.1,.1
1
2
3
4
5
6
以及第3-5处：
ctrl+f查找yolo，修改三处yolo上面的filters，以及yolo下面的classes：

[convolutional]
size=1
stride=1
pad=1
filters=21 # 修改为(类别数+5)*3
activation=linear

[yolo]
mask = 0,1,2
anchors = 12, 16, 19, 36, 40, 28, 36, 75, 76, 55, 72, 146, 142, 110, 192, 243, 459, 401
classes=2 # 修改为类别数，20
num=9
1
2
3
4
5
6
7
8
9
10
11
12
13
4.修改data/voc.names文件（注意，之前训练PASCAL数据集是没有这个步骤的）
voc.names文件中保存的是VOC数据集的类别（20个），我们要修改为自己数据集的类别。

aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
改为：

green light
red light
1
2
5.训练
训练之前，转移或删除darknet/backup中之前得到的权值文件。

./darknet detector train cfg/voc.data cfg/yolo-obj.cfg yolov4.conv.137
1
如果要打印loss曲线，同时打印map值，在后面加-map：

./darknet detector train cfg/voc.data cfg/yolo-obj.cfg yolov4.conv.137 -map
1
训练完得到四个权值文件（已重命名）：

指定GPU或者多GPU训练、打印训练log、段错误的解决方法等，可以看训练PASCAL VOC数据集的训练部分。

训练完map为0的问题
如果训练完发现map为0，有可能是：1.没有改voc_label.py中的类名。2.没有使用正确的预训练模型(yolov4.conv.137)。3.数据集有问题，或者没有成功转为yolo格式。
如果要计算每个权值文件的mAP值，可以：

./darknet detector map cfg/voc.data cfg/yolo-obj.cfg backup/yolo-tflight_1000.weights
1
然后可以选一个mAP值最高的权值文件测试。
6.测试
测试单张图片：

./darknet detector test cfg/voc.data cfg/yolo-obj.cfg backup/yolo-tflight_4000.weights
1
测试视频(需要OpenCV)：

./darknet detector demo cfg/voc.data cfg/yolo-obj.cfg backup/yolo-tflight_4000.weights -ext_output test.mp4
1
看一下效果：

批量测试图片并保存
如果要测试大量图片，一张一张测试是非常麻烦的，为了能够批量测试图片，并保存在指定文件夹中，需要以下操作：
1.修改darknet/src/detector.c文件
在detector.c文件的开头位置，添加GetFilename函数，为了解决上个版本文件名长度的问题，这里做了修改，直接将上个版本的常数用变量length替代，length是测试图片的文件名，因为要去掉".jpg"，所以strncpy那里要用"length-4"。代码亲测有效。

static int coco_ids[] = {1,2,3,4,5,6,7,8,9,10,11,13,14,15,16,17,18,19,20,21,22,23,24,25,27,28,31,32,33,34,35,36,37,38,39,40,41,42,43,44,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,67,70,72,73,74,75,76,77,78,79,80,81,82,84,85,86,87,88,89,90};

// 在下面添加GetFilename函数
char *GetFilename(char *p)
{
static char name[64]; // 作为返回值不能是局部变量
memset(name, 0, sizeof(name)); // 清空之前的静态变量
int length = 0;

char *q = strrchr(p,'/') + 1; // 获取第一个'/'后面的位置
length = strlen(q);
strncpy(name,q,length-4); // 赋值并且不要后缀
return name;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
ctrl+f查找save_image，查找下一个，然后找到"save_image(im, "predictions")"，替换源代码：

// save_image(im, "predictions");
char b[64];
snprintf(b, 64, "output/%s", GetFilename(input));
save_image(im, b);
1
2
3
4
然后在darknet目录下重新make。
2.准备包含所有需要检测图片路径的txt文件
将需要检测的图片放在darknet/data/test文件夹下，然后在darknet/data下新建一个py文件：

touch make_test_txt.py
1
文件中的内容为：

# coding: utf-8
import os

paths = "./test" # 测试图片的路径
f = open('test.txt', 'w') # 最后得到的图片路径txt文件
filenames = os.listdir(paths)
filenames.sort()
for filename in filenames:
out_path = "data/test/" + filename # 引号内为测试图片文件夹的路径
print(out_path)
f.write(out_path + '\n')
f.close()
1
2
3
4
5
6
7
8
9
10
11
12
然后运行make_test_txt.py，在data目录下会生成一个test.txt文件。
3.批量测试
在darknet目录下新建一个文件夹output，运行：

./darknet detector test cfg/voc.data cfg/yolo-obj.cfg backup/yolo-tflight_4000.weights -ext_output -dont_show <data/test.txt> result.txt
1
注意，保存测试图片文件名的test.txt文件两边有< >，result.txt是把检测的文本输出打印出来，可有可无，检测的图片输出保存在output文件夹中。

将weights权值文件转换为tflite权值文件
将模型移植到安卓端需要将weights文件转换为tflite文件，系统环境：
Tensorflow 2.1.0
tensorflow_addons 0.9.1
运行时可能会提升缺少其他安装包，根据提示使用pip安装即可。
首先克隆代码到本地：

git clone https://github.com/hunglc007/tensorflow-yolov4-tflite.git
1
然后只需要修改tensorflow-yolov4-tflite-master/data/classes/coco.names，将内容修改为自己的类别名：

green light
red light
1
2
或者在data/classes中新建一个.names文件，比如“tfclight.names”，内容为自己的类名。然后打开core/config.py，将

__C.YOLO.CLASSES = "./data/classes/coco.names"
1
改为

__C.YOLO.CLASSES = "./data/classes/tfclight.names"
1
接着将要转换的weight文件放在data目录下。
最后在tensorflow-yolov4-tflite-master目录下，选择以下其中一条命令运行：

# yolov4非量化转换
python convert_tflite.py --weights ./data/yolo-tflight_4000.weights --output ./data/yolo-tflight_4000.tflite

# yolov4 quantize float16（量化转换）
python convert_tflite.py --weights ./data/yolo-tflight_4000.weights --output ./data/yolo-tflight_4000-fp16.tflite --quantize_mode float16
1
2
3
4
5
得到的结果：

参考：tensorflow-yolov4-tflite

附加内容
附加的内容由于篇幅原因，请移步到另一篇博客：https://blog.csdn.net/Creama_/article/details/107960513

显示检测框的置信度
改变检测框的粗细
保存检测框的内容到本地(批量图片检测)
保存检测框的内容到本地(视频检测)
————————————————
版权声明：本文为CSDN博主「Creama_」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/Creama_/article/details/106209388

posted @ 2022-12-06 19:33 eastgeneral 阅读(894) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

eastgeneral

手把手教你在服务器上用YOLOv4训练和测试数据集（保姆级） 转载

公告

手把手教你在服务器上用YOLOv4训练和测试数据集（保姆级）转载