pandas中pd.read_csv()方法中的encoding参数
当使用pd.read_csv()方法读取csv格式文件的时候,常常会因为csv文件中带有中文字符而产生字符编码错误,造成读取文件错误,在这个时候,我们可以尝试将pd.read_csv()函数的encoding参数设置为"gbk"或者"utf-8",例子如下:
1 import pandas as pd 2 import numpy as np 3 4 head = ["表头1" , "表头2" , "表头3"] 5 l = [[1 , 2 , 3],[4,5,6] , [8 , 7 , 9]] 6 df = pd.DataFrame (l , columns = head) 7 df.to_csv ("testfoo.csv") 8 9 df2 = pd.read_csv ("testfoo.csv" , encoding = "gbk") 10 print (df2)
结果如下:
Unnamed: 0 表头1 表头2 表头3 0 0 1 2 3 1 1 4 5 6 2 2 8 7 9