会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
天道酬勤,厚德载物,自强不息,求真务实,动脑动手,孜孜以求
StudyDo
天道酬勤,厚德载物,自强不息,求真务实,动脑动手,孜孜以求
博客园
::
首页
::
博问
::
闪存
::
新随笔
::
联系
::
订阅
::
管理
::
公告
2020年2月18日
使用C#阅读pdf内容,并对其进行提取
摘要: 有很多语言都可以对pdf内容进行提取,我提取pdf文件的目的主要是为了对pdf内容进行分析。 查找了不少这方面的资料,很多都是语焉不详。 我使用VS的nugut进行查找,以pdf为关键词,找到了很多的类库可以处理该问题。综合一切判断,选择iText为基础进行分析。 确定了Itext之后,查阅相关文档,得到其获取内容的代码如下: //创建阅读器,Item是文件路径 ...
阅读全文
posted @ 2020-02-18 15:36 三木人
阅读(4461)
评论(1)
推荐(0)
编辑