随着市面上越来越多的扫描版pdf,总有冲动把他们转成文字格式。

下面出场的是伟大的Adobe公司伟大的Acrobat软件第十版Adobe Acrobat X Pro和盛名在外的ABBYY FineReader 10。

Acrobat只要另存为pdf并开启ocr识别即可,ocr选项如下图:

语言只能选一个中文。

识别结果如下图所示:

中文的结果很难让人看懂。

接下去看ABBYY FineReader 10,语言已经可以指定2种,这里设置为中文加英文:

选择项也很多:

识别结果如下,90%左右,和Adobe Acrobat X Pro比起来已经很牛B了。

本文地址<http://www.cnblogs.com/yuwei/archive/2011/04/23/2025763.html>,转载请注明出处。

posted on 2011-04-23 17:25  俞炜  阅读(8267)  评论(0编辑  收藏  举报