2018年3月15日

python爬虫解决gbk乱码问题

摘要: 今天尝试了下爬虫,爬取一本小说,忘语的凡人修仙仙界篇,当然这样不好,大家要支持正版。 爬取过程中是老套路,先获取网页源代码 结果:乱码 在浏览器看下代码,是gbk编码,需要进行转码,这方面不清楚,查了下资料。 PS:爬取的所有网页无论何种编码格式,都转化为utf-8格式进行存储,与源代码编码格式不同 阅读全文

posted @ 2018-03-15 11:46 逆水城殇 阅读(28826) 评论(0) 推荐(6) 编辑

导航