会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
TheLuther
博客园
首页
新随笔
联系
订阅
管理
2014年8月25日
借鉴StanZhai核心代码,写了个博客园采集器
摘要: 借鉴StanZhai核心代码,写了个博客园采集器,实现了文章正文和页面图片本地化,可以当成离线阅读器使用。收录的文章,概要信息写入sqlite数据库,可实现标题、正文的检索,功能比较简单,自己用应该挺方便的。自认为知识点有几个:1、提取正文一般来说,提取正文用正则要好一点,但是如果文章模板不同,那么...
阅读全文
posted @ 2014-08-25 22:57 TheLuther
阅读(244)
评论(0)
推荐(0)
编辑
公告