爬虫 解码gb1312类型

今天我爬虫的时候竟然遇见了网页编码为gb1312类型的网站  , 不是平常的utf-8

遇到这种类型的时候忽视它是最好的办法

 ① respond.content.decode('gb18030','ignore')  ---亲试遇见中文响应内容解析还是用这种方式好

                            ② respond.content.decode('gbk','ignore') 

 

总结:遇见中文编码decode里面,'gbk'/'gbk2312'/'gb18030'  (备用繁体编码选项没用过,可以留用'big5'/'big5hkscs')总有一款适合你 

posted @ 2019-03-13 20:58  胡先生爱大家  阅读(201)  评论(0编辑  收藏  举报