02、Pandas文件操作
Pandas文件操作:
1.文本文件:.csv/.txt
.csv 是一种特殊的 文本分隔符,默认分隔符为','
pd.read_csv
# order = pd.read_csv('文件名.csv', encoding='gbk', sep=',')
# print(type(order))
# print(order.shape)
2.通用的文本读取方式:
pd.read_table 指定文件 指定分隔符 指定 编码方式
# order = pd.read_table(r'meal_order_info.csv', sep=',', encoding='gbk')# # print(order)
3.excel文件:
.xls/.xlsx两种格式
sheetname 表格单元名称 0代表 第一个 1 代表 第二个 为 None代表 所有的单元
pd.read_excel
参数:
1、io,Excel的存储路径
2、sheet_name,要读取的工作表名称
3、header, 用哪一行作列名
4、names, 自定义最终的列名
5、index_col, 用作索引的列
6、usecols,需要读取哪些列
7、squeeze,当数据仅包含一列
8、converters ,强制规定列数据类型
9、skiprows,跳过特定行
10、nrows ,需要读取的行数
11、skipfooter , 跳过末尾n行
detail = pd.read_excel(r'meal_order_detail.xlsx', sheetname=1)
3.查看所有sheetname的名字
detail = pd.read_excel(r'meal_order_detail.xlsx', sheetname=1)
columns_list = list(detail.keys())