摘要: 1.python3不同与2版本不能使用pdfminer 2.使用pdfminer解析相应文档并保存到相应的文件夹中 阅读全文
posted @ 2019-09-08 22:39 zhangqi0828 阅读(5893) 评论(0) 推荐(0) 编辑
摘要: 详细安装博客:https://blog.csdn.net/luanyongli/article/details/81385284 第一步tesseract-ocr的安装如果不会请参照:https://blog.csdn.net/qq_37193537/article/details/81335165 阅读全文
posted @ 2019-09-08 22:11 zhangqi0828 阅读(882) 评论(0) 推荐(0) 编辑
摘要: Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。 Tess4J则是Tesseract在Java PC上的应用 Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决 阅读全文
posted @ 2019-09-08 21:46 zhangqi0828 阅读(2926) 评论(0) 推荐(0) 编辑