摘要: 之前在对tif做ocr的时候,在网上找了很多资源,最后选择了tesseract。 关于tesseract相信大多数人找到了资料无非两种,我来一一阐述一下用后的感受。 1.使用tess4j,在实测中发现这种封装后的效果极差,稍微复杂一点的文档识别出来的精度惨不忍睹。所以推荐以下一种方式。 2.安装te 阅读全文
posted @ 2019-07-07 23:58 feixiong1688 阅读(1569) 评论(0) 推荐(0) 编辑
摘要: 因为项目客观因素把关键词统计的次数放在了前端,网上查找了一些资料自己整合了一段代码。适用多个关键词及其出现次数 上代码 : 阅读全文
posted @ 2019-07-05 00:26 feixiong1688 阅读(613) 评论(0) 推荐(0) 编辑