Python爬虫中文小说网点查找小说并且保存到txt(含中文乱码处理方法)
摘要:
从某些网站看小说的时候经常出现垃圾广告,一气之下写个爬虫,把小说链接抓取下来保存到txt,用requests_html全部搞定,代码简单,容易上手. 中间遇到最大的问题就是编码问题,第一抓取下来的小说内容保持到txt时出现乱码,第二url编码问题,第三UnicodeEncodeError 先贴源代码 阅读全文
posted @ 2018-07-13 16:26 springyun 阅读(5711) 评论(0) 推荐(0) 编辑