Pandas 数据读取
1.读取table
# 读取普通分隔数据:read_table # 可以读取txt,csv import os os.chdir('F:/') #首先设置一下读取的路径 data1 = pd.read_table('data1.txt', delimiter=',',header = 0) print(data1) data1 = pd.read_table('data1.txt', delimiter=',',header = 0, index_col=1) #index_col = 1把var2那列作为索引 print(data1) # delimiter:用于拆分的字符,也可以用sep:sep = ',' # header:用做列名的序号,默认为0(第一行) header = 0 默认把第一行当作列来做参考 # index_col:指定某列为行索引,否则自动索引0, 1, ..... 不指定就没有 # read_table主要用于读取简单的数据,txt/csv
输出结果:
va1 va2 va3 va4 0 1 2 3 4 1 2 3 4 5 2 3 4 5 6 3 4 5 6 7 va1 va3 va4 va2 2 1 3 4 3 2 4 5 4 3 5 6 5 4 6 7
2.读取csv数据
# 读取csv数据:read_csv # 先熟悉一下excel怎么导出csv data2 = pd.read_csv('data2.csv',encoding = 'utf-8') print(data2.head()) # encoding:指定字符集类型,即编码,通常指定为'utf-8' # 大多数情况先将excel导出csv(excel另存为csv格式),再读取
3.读取excel数据
# 读取excel数据:read_excel data3 = pd.read_excel('数据库.xlsx',sheet_name='数据库',header=0) print(data3.head()) # io :文件路径。 # sheetname:返回多表使用sheetname=[0,1],若sheetname=None是返回全表 → ① int/string 返回的是dataframe ②而none和list返回的是dict #sheetname可以写表本身的名称,也可以写0,1,2指的是读取这个excel里面哪一页的表 # header:指定列名行,默认0,即取第一行 # index_col:指定列为索引列,也可以使用u”strings”