pandas中pd.read_csv()方法中的encoding参数

当使用pd.read_csv()方法读取csv格式文件的时候,常常会因为csv文件中带有中文字符而产生字符编码错误,造成读取文件错误,在这个时候,我们可以尝试将pd.read_csv()函数的encoding参数设置为"gbk"或者"utf-8",例子如下:

 1 import pandas as pd
 2 import numpy as np
 3 
 4 head = ["表头1" , "表头2" , "表头3"]
 5 l = [[1 , 2 , 3],[4,5,6] , [8 , 7 , 9]]
 6 df = pd.DataFrame (l , columns = head)
 7 df.to_csv ("testfoo.csv")
 8 
 9 df2 = pd.read_csv ("testfoo.csv" , encoding = "gbk")
10 print (df2)

结果如下:

   Unnamed: 0  表头1  表头2  表头3
0           0    1    2    3
1           1    4    5    6
2           2    8    7    9
posted @ 2017-05-04 16:08  maoguy  阅读(14941)  评论(0编辑  收藏  举报