2018 年 3月 15 日随笔档案 - 逆水城殇

2018年3月15日

python爬虫解决gbk乱码问题

摘要：今天尝试了下爬虫，爬取一本小说，忘语的凡人修仙仙界篇，当然这样不好，大家要支持正版。爬取过程中是老套路，先获取网页源代码结果：乱码在浏览器看下代码，是gbk编码，需要进行转码，这方面不清楚，查了下资料。 PS：爬取的所有网页无论何种编码格式，都转化为utf-8格式进行存储，与源代码编码格式不同阅读全文

posted @ 2018-03-15 11:46 逆水城殇阅读(28826) 评论(0) 推荐(6) 编辑

python爬虫解决gbk乱码问题

导航

公告