Python pandas基本使用

导入包

import pandas as pd

读取数据 read_excel()

如果您想读取 Excel 表格中的数据，可以使用 read_excel() 方法，其语法格式如下：

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, **kwds

下表对常用参数做了说明：

参数名称	说明
io	表示 Excel 文件的存储路径。
sheet_name	要读取的工作表名称。
header	指定作为列名的行，默认0，即取第一行的值为列名；若数据不包含列名，则设定 header = None。若将其设置为 header=2，则表示将前两行作为多重索引。
names	一般适用于Excel缺少列名，或者需要重新定义列名的情况；names的长度必须等于Excel表格列的长度，否则会报错。
index_col	用做行索引的列，可以是工作表的列名称，如 index_col = '列名'，也可以是整数或者列表。
usecols	int或list类型，默认为None，表示需要读取所有列。
squeeze	boolean，默认为False，如果解析的数据只包含一列，则返回一个Series。
converters	规定每一列的数据类型。
skiprows	接受一个列表，表示跳过指定行数的数据，从头部第一行开始。
nrows	需要读取的行数。
skipfooter	接受一个列表，省略指定行数的数据，从尾部最后一行开始。

取该文档第一列：

data = pd.read_excel(fileDir,usecols=[0])

将第一列值转换成list[list]

data = pd.read_excel(fileDir,usecols=[0]).values.tolist()

完整：

import pandas as pd
from pathlib import Path

fileDir = Path.cwd().parent.joinpath("testFile","testUserinfo.xls")
#用户文件地址

def get_userid():
    data = pd.read_excel(fileDir,usecols=[0]).values.tolist()
    #读取指定文件，取第一列值转换成list[list]
    return data

posted @ 2022-03-24 00:32 青山原阅读(185) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

青山原

Python pandas基本使用

导入包

读取数据 read_excel()

公告