pyquery 读取HTML报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 78: illegal multibyte sequence

今天学习pyquery 读取HTML文件时,报错

这是字符编码错误,读取的时候不能读取gbk格式的字符

然后打开HTML文档,发现里面有中文字符,将中文字符去掉之后就可以执行了。

 

 

posted @ 2018-09-12 10:02  大神笨蛋  阅读(2217)  评论(1编辑  收藏  举报