'utf-8' codec can't decode byte 0xd0 in position 0问题

今天利用pd.read_csv(url)从网络上读取数据时出现了如下错误:

'utf-8' codec can't decode byte 0xd0 in position 0

问题原因:网络上的这个文件不是 UTF8 编码的,而系统默认采用 UTF8 解码,用UTF8编解码器无法解码该文件。

但是如果把该文件的编码方式改为UTF8,文件又变成乱码格式,如下:

 

 

解决办法:

新建一个txt文件,把内容复制进去,点击另存为,在编码的地方选择UTF-8,再用pd.read_csv(),完美解决

 

 

备注:sublime text3界面默认是不显示文件编码方式的,如果要想在右下角显示文件编码方式,可以

preference --> settings --> 加入如下代码:

"show_encoding": true,
"show_line_endings": true,

 

posted @ 2018-10-26 00:33  帅帅的飞猪  阅读(18678)  评论(0编辑  收藏  举报