爬虫 解码gb1312类型
今天我爬虫的时候竟然遇见了网页编码为gb1312类型的网站 , 不是平常的utf-8
遇到这种类型的时候忽视它是最好的办法
① respond.content.decode('gb18030','ignore') ---亲试遇见中文响应内容解析还是用这种方式好
② respond.content.decode('gbk','ignore')
总结:遇见中文编码decode里面,'gbk'/'gbk2312'/'gb18030' (备用繁体编码选项没用过,可以留用'big5'/'big5hkscs')总有一款适合你