云朵的冥想

导航

2018年7月13日 #

Python爬虫中文小说网点查找小说并且保存到txt(含中文乱码处理方法)

摘要: 从某些网站看小说的时候经常出现垃圾广告,一气之下写个爬虫,把小说链接抓取下来保存到txt,用requests_html全部搞定,代码简单,容易上手. 中间遇到最大的问题就是编码问题,第一抓取下来的小说内容保持到txt时出现乱码,第二url编码问题,第三UnicodeEncodeError 先贴源代码 阅读全文

posted @ 2018-07-13 16:26 springyun 阅读(5644) 评论(0) 推荐(0) 编辑