pandas读取文件编码错误
读取文件: df = pd.read_csv("test.csv")
报错:
文件直接修改后缀名为.csv ,用read_csv读取会报错,需要传一个参数:error_bad_lines=False 即可
df = pd.read_csv("ww45-clean.csv", error_bad_lines=False, encoding="utf-8")
报错:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa0 in position 0: invalid continuation byte
解决方案:用notepad++打开这个文件,将文件用Unicode编码重新保存
将文件的编码格式改为UTF8无BOM格式即可