数据加载、存储
read_csv():从文件、URL、文件对象中加载带分隔符的数据。默认分隔符为逗号。
read_table():从文件、URL、文件对象中加载带分隔符的数据。默认分隔符为制表符('\t')。
参数:
header = None#当文本无标题行时,让pandas为其分配默认的列名。 names = ['a','b','c']#当文本无标题行时,为其自定义列名。 sep = ','#以‘,’作为数据的分隔符。 index_col = ['key1','key2']#指定key1和key2为表格的索引。 skip_rows = [0,2,5]#跳过1,3,6行。 na_values = ‘foo’#将foo值识别为空值。 nrows = 5#读取文件的前五行。 chunksize = 1000#分块大小来读取文件(每次读取多少行),不一次性把文件数据读入内存中,而是分多次
例子:
#读取数据 pd.read_csv('examples/ex6.csv') #将数据写出到文本格式 data.to_csv('examples/out.csv')