Python pandas基本使用
导入包
- import pandas as pd
读取数据 read_excel()
- 如果您想读取 Excel 表格中的数据,可以使用 read_excel() 方法,其语法格式如下:
- pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, **kwds
- 下表对常用参数做了说明:
参数名称
|
说明
|
io
|
表示 Excel 文件的存储路径。
|
sheet_name
|
要读取的工作表名称。
|
header
|
指定作为列名的行,默认0,即取第一行的值为列名;若数据不包含列名,则设定 header = None。若将其设置
为 header=2,则表示将前两行作为多重索引。
|
names
|
一般适用于Excel缺少列名,或者需要重新定义列名的情况;names的长度必须等于Excel表格列的长度,否则会报错。
|
index_col
|
用做行索引的列,可以是工作表的列名称,如 index_col = '列名',也可以是整数或者列表。
|
usecols
|
int或list类型,默认为None,表示需要读取所有列。
|
squeeze
|
boolean,默认为False,如果解析的数据只包含一列,则返回一个Series。
|
converters
|
规定每一列的数据类型。
|
skiprows
|
接受一个列表,表示跳过指定行数的数据,从头部第一行开始。
|
nrows
|
需要读取的行数。
|
skipfooter
|
接受一个列表,省略指定行数的数据,从尾部最后一行开始。
|
- 取该文档第一列:
data = pd.read_excel(fileDir,usecols=[0])
- 将第一列值转换成list[list]
data = pd.read_excel(fileDir,usecols=[0]).values.tolist()
- 完整:
import pandas as pd from pathlib import Path fileDir = Path.cwd().parent.joinpath("testFile","testUserinfo.xls") #用户文件地址 def get_userid(): data = pd.read_excel(fileDir,usecols=[0]).values.tolist() #读取指定文件,取第一列值转换成list[list] return data