摘要: 借鉴StanZhai核心代码,写了个博客园采集器,实现了文章正文和页面图片本地化,可以当成离线阅读器使用。收录的文章,概要信息写入sqlite数据库,可实现标题、正文的检索,功能比较简单,自己用应该挺方便的。自认为知识点有几个:1、提取正文一般来说,提取正文用正则要好一点,但是如果文章模板不同,那么... 阅读全文
posted @ 2014-08-25 22:57 TheLuther 阅读(244) 评论(0) 推荐(0) 编辑