2014年1月15日
摘要: 这一节主要内容是使用正则表达式提取网站的正文,主要面向于小说章节网站。其中涉及到一些其他知识点,比如异步读取、异步流写入等,代码中都会有详细的注解。现在流行的网络文学都是每日一更或几更,没有一个统一的下载入口。以下我将实现一个简单的章节小说下载器的功能,将章节小说以整本的形式下载保存,保守估计能下载网络上70%以上小说。先看看小说网站的网页源码,天蚕土豆的大主宰第一章。http://www.biquge.com/4_4606/991334.html 笔趣网http://www.fqxsw.com/html/11739/4636404.html 番茄小说网正文正则结果发现正文内容一般都是嵌套在. 阅读全文
posted @ 2014-01-15 10:39 即使很偶然 阅读(4357) 评论(0) 推荐(1) 编辑