摘要: 做一个简单的练习 目标:爬取中文小说 目标网站:http://www.biqule.com/book_58/26986.html 只爬取正文部分。 使用requests库来获取网页信息,使用re库正则匹配正文文本。 这里有一点需要注意的是测试时是使用linux环境下的python,默认编码为utf- 阅读全文
posted @ 2017-10-11 19:54 TREES树海 阅读(291) 评论(0) 推荐(0) 编辑