点击关注我的GitHub

pandas的read_csv使用方法总结

pandas在读取csv文件的时候是通过reaad_csv这个函数进行函数读取的

f = open('file.csv',encoding='utf-8')

cont = pd.read_csv(f)

 

其中比较重要的是,在读取csv文件的时候文件内的分隔符号和函数中指定的分隔符号

要一致,pd.read_csv(...,sep='\t')

 

用户header设置导入DataFrame的列的名称,默认是‘infer’,但是要注意它与names之间的关系。

(1)当names没有被赋值的时候,header变成0,这时候是选取数据文件的第一行当做列的名字。

(2)当names有值,但是header没有值时,header会变成None。

 

index_col参数:生成DataFrame的时候索引默认是0,1,3,4,...我们可以设置set_index,但是也尅在读取的时候就指定某一个列为索引。

pd.read_csv('file.csv',delim_withspace=True,index_col='name')

 

usecols:只选出指定的列,pd.read_csv('file.csv',usecols=['name','address'])

nrows:参数设置一次性读入的文件的行数,它在读入大的文件的时候是非常有用的

pd.read_csv('file.csv',sep='\t',nrows=30)

 

posted @ 2022-09-03 09:38  justkeen  阅读(484)  评论(0编辑  收藏  举报