pandas读取文件csv、txt的参数学习:
pandas读取文件csv、txt的参数学习:
格式:pandas.read_csv(filepath_or_buffer,sep,delimiter,header,names,index_col,usecols,squeeze)
1.filepath_or_buffer:设置需要访问的文件的有效路径.例:'D:/Demo/tset.csv'亦可以使用变量;如预先设置变量fpath='D:/Demo/tset.csv';
pandas.read_csv(fpath)
2.sep:str, default ',';指定分隔符。如果不指定参数,则会尝试使用默认的逗号分隔。分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器。并且忽略数据中的逗号。正则表达式例子:'\r\t'
pandas.read_csv(fpath,sep='\t')
3.delimiter:str, default None;定界符,备选分隔符(如果指定该参数,则sep参数失效)
4.header:str, default None;默认第一行为表头列名
指定作为整个数据集列名的行.如果数据集中没有列名,则需要设置header=None.对有表头的数据识别第一行作为header.
5.names :array-like, default None;执行header=None后设置列名
用于结果的列名列表,如果数据文件中没有列标题行,就需要执行header=None。
6.index_col:int or sequence or False, default None
指定数据集中的某1列作为索引(index_col = 1/2).缺省不设置数据自动添加index[0,1,2......]
7.usecols:array-like, default None;指定只读取文件中的某部分列数据
指定只读取文件中的某一列数据.例如:只读取前四列,usecols = [0,1,2,3])
8.squeeze:boolean, default False
如果文件值包含一列,则返回一个Series.