在杂七杂八的事中坚持处理表格的OCR,历经一周时间,终有阶段结果。
主要工作:
自动分区、文字识别。
象这样一个表格:
自动分区后,得到正确分区效果:
其中,各分区模块颜色配置:
文字识别结果:
识别正确率在70%-80%。可以手动校对:
剩下的工作是自动生成WORD与PDF。这两项工作完成后,可以定一版了。
6.10前预交付市场。
posted on 2013-06-03 23:40 drgraph 阅读(1866) 评论(1) 编辑 收藏 举报
Powered by: 博客园 Copyright © 2024 drgraph Powered by .NET 8.0 on Kubernetes