摘要: 之前用百度的云收藏时,觉得这个功能挺神奇的,不管打开什么样的网页总能准确地抓取其中正文部分。前不久看到python做网页内容抓取。实现起来也挺容易的。 直接上代码: 以一本小说为例来测试,要抓取网页中的 文章标题,正文,下一页链接。 中间注释的部分用作测试的,可以测试看能不能正确抓取到网页中的内容, 阅读全文
posted @ 2016-07-08 09:54 BH78 阅读(225) 评论(0) 推荐(0) 编辑