随着市面上越来越多的扫描版pdf,总有冲动把他们转成文字格式。
下面出场的是伟大的Adobe公司伟大的Acrobat软件第十版Adobe Acrobat X Pro和盛名在外的ABBYY FineReader 10。
Acrobat只要另存为pdf并开启ocr识别即可,ocr选项如下图:
语言只能选一个中文。
识别结果如下图所示:
中文的结果很难让人看懂。
接下去看ABBYY FineReader 10,语言已经可以指定2种,这里设置为中文加英文:
选择项也很多:
识别结果如下,90%左右,和Adobe Acrobat X Pro比起来已经很牛B了。
本文地址<http://www.cnblogs.com/yuwei/archive/2011/04/23/2025763.html>,转载请注明出处。