pandas的read_csv使用方法总结
pandas在读取csv文件的时候是通过reaad_csv这个函数进行函数读取的
f = open('file.csv',encoding='utf-8')
cont = pd.read_csv(f)
其中比较重要的是,在读取csv文件的时候文件内的分隔符号和函数中指定的分隔符号
要一致,pd.read_csv(...,sep='\t')
用户header设置导入DataFrame的列的名称,默认是‘infer’,但是要注意它与names之间的关系。
(1)当names没有被赋值的时候,header变成0,这时候是选取数据文件的第一行当做列的名字。
(2)当names有值,但是header没有值时,header会变成None。
index_col参数:生成DataFrame的时候索引默认是0,1,3,4,...我们可以设置set_index,但是也尅在读取的时候就指定某一个列为索引。
pd.read_csv('file.csv',delim_withspace=True,index_col='name')
usecols:只选出指定的列,pd.read_csv('file.csv',usecols=['name','address'])
nrows:参数设置一次性读入的文件的行数,它在读入大的文件的时候是非常有用的
pd.read_csv('file.csv',sep='\t',nrows=30)