PPadleOCR 自己的数据训练
在github里面下载PaddleOCR源码后,接下来开始一一安装:
1、安装Python,此处必须安装3.8--3.10的版本,3.11版本目前是不支持的,容易报错。
2、依次安装
python -m pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple
python -m pip install PPOCRLabel -i https://pypi.tuna.tsinghua.edu.cn/simple -- 标注工具
PPOCRLabel --lang ch
在此安装过程中有两个依赖,得注意安装:
ModuleNotFoundError: No module named 'Polygon'
这个安装时,必须使用 python -m pip install Polygon3 -i https://pypi.tuna.tsinghua.edu.cn/simple
ModuleNotFoundError: No module named 'lanms'
这个安装时,必须使用 python -m pip install lanms-nova -i https://pypi.tuna.tsinghua.edu.cn/simple
3、在标注工具里面识别后,及时保存相关数据。
4、下载训练模型
根据自己的需要下载 https://github.com/PaddlePaddle/PaddleOCR :
5、修改训练的配置文件:
6、标记train 下的文件
修改之前识别有问题的label文件,标记为正确的。
7、执行命令(建议路径用完全路径)
python tools/train.py -c configs/det/det_mv3_db.yml
部分参数一定设置小,否则个人电脑容易硬件性能不足的报错。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现