PPadleOCR 自己的数据训练

          在github里面下载PaddleOCR源码后,接下来开始一一安装:
          1、安装Python,此处必须安装3.8--3.10的版本,3.11版本目前是不支持的,容易报错。

          2、依次安装

                 python -m pip install paddlepaddle  -i https://pypi.tuna.tsinghua.edu.cn/simple        

                 python -m pip install PPOCRLabel    -i https://pypi.tuna.tsinghua.edu.cn/simple         -- 标注工具

                 PPOCRLabel --lang ch       

                在此安装过程中有两个依赖,得注意安装:
               ModuleNotFoundError: No module named 'Polygon'
               这个安装时,必须使用  python -m pip install Polygon3 -i https://pypi.tuna.tsinghua.edu.cn/simple

               ModuleNotFoundError: No module named 'lanms'

               这个安装时,必须使用  python -m pip install lanms-nova  -i https://pypi.tuna.tsinghua.edu.cn/simple

 

          3、在标注工具里面识别后,及时保存相关数据。

             4、下载训练模型

                    根据自己的需要下载 https://github.com/PaddlePaddle/PaddleOCR :

 

             5、修改训练的配置文件:

          6、标记train 下的文件

                修改之前识别有问题的label文件,标记为正确的。

 

          7、执行命令(建议路径用完全路径)

               python tools/train.py -c configs/det/det_mv3_db.yml

      

          部分参数一定设置小,否则个人电脑容易硬件性能不足的报错。

 

posted @ 2023-12-09 17:41  中级菜鸟  阅读(264)  评论(0编辑  收藏  举报