完成工作:
调试了pdf解析最基本的几个功能,改了几个bug,看bug的情况应该还有很多bug。。
关于pdf解析的接口功能、以及如何使用,我待会会发一封邮件,因为我这块连不上github,挂了代理在mac里莫名其妙的也还是不行。。
Reference解析难度太大了,我觉得可能要留到beta版在做了,现在只能进行初步的解析,抓出author和title,而且author跟title中间必须用句号分开。。(我今天刚看了一篇用冒号分开的),不能handle的情况:
1. author名字中连续两个缩写里没有空格,比如 K.M. xxx
2. author或者title不以句号结尾。
3. reference中间夹了页码、footnote、running head,reference后边有appendix或者其他内容的情况。
明天工作:
我明天晚上才能回来干活,我会把我的代码部分发一封邮件,里边有一个简单的demo。拜托明天白天有时间的筒子连接起来。