pdf文件的处理(弄成小容量大小的文本文件)

问题的提出:

pdf文件大多是扫描书籍后制作成的,容量很大,可我要把它弄成文本文件,这样可以放在手机上,遇到的问题就是怎么转换

问题的解决

1.没有灵丹妙药,就是没有专门的转换工具直接转换,如果有,那是骗人的

2.pdf有安全加密,一种是低档次的普通加密,一种是高档次的安全证书加密

3.对pdf的安全程度进行了解,并根据不同的方式来解决:简单加密就用普通的剔除pdf密码的工具来把安全级别降低下来;安全证书的加密就要从源头上将密码剔除,因为网络流行的pdf文档密码剔除工具会报错:【此文档是以“Adobe.PubSec[adbe.pkcs7.s5] 128-bit security v.4”加密处理程序创建。不支持这种保护方式。】。

4.被剥夺安全性的pdf文件有水印,这个最简单了,用Adobe Acrobat这个软件把水印取消掉然后保存就可以了

5.Adobe Acrobat软件有个很可爱的功能,导出成tif格式,就是这个功能最关键,它把所有的页面分别一张张地导出成tif格式的文件。   不要小看这个格式,因为它的应用非常重要,首先容量小,其次它可以以图片的形式让XP版本以上的操作系统直接显示,再次假如有装OFFICE,OFFICE自动就用自己的工具来读取它,再次只有tif格式的文件能被特定软件转换成文字。

6.买过清华紫光扫描仪的人知道,它有附带一个OCR软件来识别扫描的书籍并转换成文字,这个软件的使用很简单,可以整页识别,可以手工定位识别区别直接转换成文字,注意含有图片的那一页千万不要让它整页自动识别,不然出来的是一堆乱码。

7.一页一页识别出来的文字,再把它的文字和图片逐页复制到WORD文档中,我们自己制作的WORD文件就可以放到手机上,而且内容可以自己随心定,大小可以自己随意控制,手机识别的时候也不用加载老半天。

8.关于OCR软件,网络上有或者买扫描仪的时候有光盘;关于PDF的安全证书的剔除,这里不讲,以尊重知识产权为重。

posted on 2009-06-28 18:35  黄玮璘  阅读(1257)  评论(0编辑  收藏  举报

导航