PaddleDetection的CPU训练

主要目的是在没有GPU的情况下，上手ppyolo的训练过程，看看paddlepaddle是不是顺手。纯代码实验。PaddleDetection在下文中简称ppdet。

1 基本环境

1.1 软件组成和版本
Windows>= 7

python=3.8

paddle.__version__ '2.3.2'
ppdet.__version__ '2.4.0'

1.2 数据集
HelmetDetection（VOC）

1.3 网络结构
ppyolo_r50vd_dcn

1.4 预训练模型
ResNet50_vd_ssld_pretrained.pdparams

2 环境的搭建

2.1 PaddlePaddle的安装

PaddleDetection依赖apddlepaddle，对于paddlepaddle来说，CPU分为支持avx和不支持avx（比如：Intel Core 2 Q8300），需要手动执行安装。

不支持avx的安装命令

pip install https://paddle-wheel.bj.bcebos.com/2.3.0/windows/windows-cpu-mkl-noavx/paddlepaddle-2.3.0-cp38-cp38-win_amd64.whl

支持avx的安装命令

python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

2.2 PaddleDetection的安装

PaddleDetection的安装相对简单，没有分支。
我这里是在 D:\lusong\ppdetection\ 目录下操作。

安装

命令行

git clone https://gitee.com/paddlepaddle/PaddleDetection

cd PaddleDetection
pip install -r requirements.txt

python setup.py install

验证

命令行

python ppdet/modeling/tests/test_architectures.py

2.3 数据集

数据集是偶然看到的VOC格式，下载地址为：

http://aistudio.baidu.com/aistudio/projectdetail/1059610

我自己解压缩到 D:\lusong\other\det\HelmetDetection目录。

2.4 预训练模型

模型为RestNet50，下载地址为：

https://paddledet.bj.bcebos.com/models/pretrained/ResNet50_vd_ssld_pretrained.pdparams

到此，下载部分结束，可以断开网络继续操作。

3 训练前处理

3.1 数据集拆分

对数据集完成训练集，验证集，测试集的切分。下面是拆分代码：

import os.path as osp
import random
import xml.etree.ElementTree as ET

# dataset_dir，数据集所在路径，文件夹层级如下：
{dataset_dir}/
  images/
    xxx.jpg
  annotations/
    xxx.xml
# val_percent，验证百分比
# test_percent，测试百分比
# save_dir，数据集保存到路径（格式：VOC），注意这里和标准的VOC格式是不一样的
{save_dir}/
  train_list.txt
  val_list.txt
  test_list.txt
  labels.txt
# 注意，由上可见：本函数默认dataset_dir和save_dir是同一目录
def split_voc_dataset(dataset_dir, val_percent, test_percent, save_dir):
    # 注意图片目录和标注目录名已全部修改？？？
    # 检查images目录和annotations目录是否存在
    if not osp.exists(osp.join(dataset_dir, "images")):
        logging.error("\'images\' is not found in {}!".format(dataset_dir))
    if not osp.exists(osp.join(dataset_dir, "annotations")):
        logging.error("\'annotations\' is not found in {}!".format(
            dataset_dir))
    #
    # 获取images目录下所有文件名（images目录及下一层目录）
    all_image_files = list_files(osp.join(dataset_dir, "images"))
    #
    # 元素为 [image_file, anno_name]
    image_anno_list = list()
    # 元素为 anno_name文件中的所有object.name文本（去重）
    label_list = list()
    for image_file in all_image_files:
        if not is_pic(image_file):
            continue
        # 在annotations目录下，寻找image_file对应的anno_name文件，找到后加入image_anno_list
        anno_name = replace_ext(image_file, "xml")
        if osp.exists(osp.join(dataset_dir, "annotations", anno_name)):
            image_anno_list.append([image_file, anno_name])
            # 将anno_name文件中的object子节点的name节点找出来，加入label_list（去重）
            try:
                tree = ET.parse(
                    osp.join(dataset_dir, "annotations", anno_name))
            except:
                raise Exception("文件{}不是一个良构的xml文件，请检查标注文件".format(
                    osp.join(dataset_dir, "annotations", anno_name)))
            objs = tree.findall("object")
            for i, obj in enumerate(objs):
                cname = obj.find('name').text
                if not cname in label_list:
                    label_list.append(cname)
        else:
            logging.error("The annotation file {} doesn't exist!".format(
                anno_name))
    #
    # 打乱image_anno_list后，拆分成train_image_anno_list，val_image_anno_list，test_image_anno_list
    random.shuffle(image_anno_list)
    image_num = len(image_anno_list)
    val_num = int(image_num * val_percent)
    test_num = int(image_num * test_percent)
    train_num = image_num - val_num - test_num
    #
    train_image_anno_list = image_anno_list[:train_num]
    val_image_anno_list = image_anno_list[train_num:train_num + val_num]
    test_image_anno_list = image_anno_list[train_num + val_num:]
    #
    # 创建{save_dir}/train_list.txt 文件
    with open(
            osp.join(save_dir, 'train_list.txt'), mode='w',
            encoding='utf-8') as f:
        for x in train_image_anno_list:
            file = osp.join("images", x[0])
            label = osp.join("annotations", x[1])
            f.write('{} {}\n'.format(file, label))
    #
    # 创建{save_dir}/val_list.txt 文件
    with open(
            osp.join(save_dir, 'val_list.txt'), mode='w',
            encoding='utf-8') as f:
        for x in val_image_anno_list:
            file = osp.join("images", x[0])
            label = osp.join("annotations", x[1])
            f.write('{} {}\n'.format(file, label))
    #
    # 创建{save_dir}/test_list.txt 文件
    if len(test_image_anno_list):
        with open(
                osp.join(save_dir, 'test_list.txt'), mode='w',
                encoding='utf-8') as f:
            for x in test_image_anno_list:
                file = osp.join("images", x[0])
                label = osp.join("annotations", x[1])
                f.write('{} {}\n'.format(file, label))
    #
    # 创建{save_dir}/labels.txt 文件
    with open(
            osp.join(save_dir, 'labels.txt'), mode='w', encoding='utf-8') as f:
        for l in sorted(label_list):
            f.write('{}\n'.format(l))
    #
    return train_num, val_num, test_num


if __name__ == "__main__":
    # 切分数据集
    split_voc_dataset('PaddleDetection/dataset/MyDataset', 0.2, 0.1, 'PaddleDetection/dataset/MyDataset')

运行上面代码完成后，训练集、验证集、测试集分别记录在文件：train_list.txt，val_list.txt，test_list.txt文件中。

3.2 数据集的配置

数据集的配置主要是写明训练集/验证集/测试集的文件位置（ppdet和数据集路径见上文所述）。

D:\lusong\ppdetection\PaddleDetection\configs\datasets\voc.yml

dataset_dir路径
该路径下包括anno_path所指文件。无需标准的VOC的两级目录：VOCdevkit/VOC2007(或VOC2012)。

代码（yml）
metric: VOC
map_type: 11point
num_classes: 4

TrainDataset:
!VOCDataSet
dataset_dir: D:\lusong\other\det\HelmetDetection
anno_path: train_list.txt
label_list: labels.txt
data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']

EvalDataset:
!VOCDataSet
dataset_dir: D:\lusong\other\det\HelmetDetection
anno_path: val_list.txt
label_list: labels.txt
data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']

TestDataset:
!ImageFolder
anno_path: dataset/voc/test_list.txt

4 训练

调用命令行：

python -u tools/train.py

 -c D:\lusong\ppdetection\PaddleDetection\configs\ppyolo\ppyolo_r50vd_dcn_voc_1.yml

 -o use_gpu=false pretrain_weights=D:\lusong\other\det\model\ResNet50_vd_ssld_pretrained.pdparams

 --eval

4.1 继续训练

有时候会意外或主动中断，如需继续训练的话，调用命令行：

python -u tools/train.py \
 -c D:\lusong\ppdetection\PaddleDetection\configs\ppyolo\ppyolo_r50vd_dcn_voc_1.yml \
 -o use_gpu=false \
 -r output/ppyolo_r50vd_dcn_voc_1/best_model \
 --eval

5 推理

中断训练后，项看当前训练的怎么样的话，调用命令行：

python -u tools/infer.py
 -c D:\lusong\ppdetection\PaddleDetection\configs\ppyolo\ppyolo_r50vd_dcn_voc_1.yml
 -o use_gpu=false weights=D:\lusong\ppdetection\PaddleDetection\output\ppyolo_r50vd_dcn_voc_1\best_model.pdparams
 --infer_img=D:\lusong\other\det\HelmetDetection\images\hard_hat_workers0.png

至此，可以启动训练，并在成功保存模型的情况下，执行推理。

6 对训练时长的缩减

6.1 修改ppyolo_r50vd_dcn_voc.yml，缩减：训练轮数，batch尺寸，保存时间间隔（轮数）。减少整个训练时长。

snapshot_epoch: 1
TrainReader:

batch_size: 2

epoch: 10

6.2 修改数据集文件，缩减：单轮训练图片数量，单轮验证图片数量。减少单轮训练时长。

缩减单轮训练图片数量：编辑train_list.txt文件，一行一个训练样本，根据训练时长整行删除即可。

缩减单轮验证图片数量：同上编辑val_list.txt文件。

7 小结
1 简单感受了一下VOC格式，划分的训练集，ppdet的配置方式，调用方式。

2 训练代码还是比较简单，很容易上手。

3 纯时间耗费不起（原训练配置ppdet估计时长为140天左右）。

4 ppdet=2.6有bug，会时不时异常退出，浪费时间巨大。

贵阳正值疫情期间，心情有点慌张。

posted on 2022-09-12 20:20 EpicBlue 阅读(1457) 评论(0) 编辑收藏举报

刷新页面返回顶部