c#抽取pdf文档标题——前言

       由于工作的需要,研究c#抽取pdf文档标题有3个月了。这项工作是一项”伟大而艰巨”的任务。应该是我目前研究工作中最长的一次。我觉得在长时间忙碌后,应该找些时间,把自己的心路历程归纳整理,倾诉给读者,使自己的心回归,重新回归自然、平静的状态。每一次的研究工作,说实话,都很累,犹如爬山。在到达山顶的那一刹那,也许你很快乐,也许你即将面临征服另一座山,问题是,我们知道自己迟早是要回归大地的。人生不是也是如此吗?我可以肯定地说,我们来源于宇宙,终将归于宇宙,至于我们从宇宙的何处而来,我不知道,我们终将去哪儿,我不知道。人生道路崎岖坎坷,也会存在诸多上坡路和下坡路,走完所有的路,终将回归。

        感慨了这么多,该是回来的时候了。

        刚开始接到任务时,首先是从网上搜集各种资料,有一些发表的论文,上面有获取pdf标题的一些流程及注意事项。然后看有没有C#开源的一些库,借助于一些库,我们就可以省很多pdf底层的研究。最后,一个同事,他是找的c++开源库实现了pdf抽取标题,给了我源码,我研究了下。主要是借鉴别人的思路。

        要做一件事情,”天时,地利,人和”,这个很重要。我认为,天时就说时机,比如说,我们正要雄心勃勃地做某件事情,突然感冒生病了,这个就是天时吧。”上天安排的最大”,我们只能择机而动,外出旅游,还选个晴天,搬家婚娶还挑个吉祥的日子,就是这个道理。那什么是地利呢?地利,我认为是我们能预估的外界条件。比如,我要创业,我没有资金,没有好的项目,那么创业有可能面临失败;我要骑小黄去上班,路不平则罢了,而且小黄质量有问题,这时候,你应该想到有可能会迟到。人和,就好理解了,你和上司关系不佳,将直接影响你的工作开展。

        这次任务,从整体上来看,这三者都具备。唯一让人遗憾的是老板把我叫到办公室说,pdf抽取标题比较简单,他拿起一个打印的pdf文档说,这标题很明显嘛,怎么需要这么长时间而且准确率还没有达到90%多以上。接着在会上,让我说下目前工作的进展,从事情的总体上来看,当时才刚刚开始,说实话,当初还处于探索问路阶段,前面是迷雾,我不知道路有多远,现在走了多少,根本不知道啊。在会上,我语言表达欠佳,遭到老板的粗鲁打断,他简单了说了下。

      幸运的是,我的女领导,直接上司,比较支持我,在我的努力下,还有她的支持下,工作才开展了下去,直到完成。

 

posted @ 2017-10-27 10:59  micDavid  阅读(262)  评论(0编辑  收藏  举报