pandas操作excel的基础知识

pandas有两个主要的数据结构，一个是Series，另一个是DataFrame。
Series一种增强的一维数组，类似于列表，由索引（index）和值（values）组成。
DataFrame是一个类似表格的二维数据结构，索引包括列索引和行索引，每列可以是不同的值类型（数值、字符串、布尔值等）。DataFrame的每一行和每一列都是一个Series

pandas读取excel

pandas.read_excel(filename, sep, header,encoding)

#各个参数解释

"""
filename：文件路径，可以设置为绝对路径或相对路径
sep：分隔符，常用的有逗号 , 分隔、\t 分隔，默认逗号分隔，read_table默认是'\t'(也就是tab)切割数据集的
header：指定表头，即列名，默认第一行，header = None, 没有表头，全部为数据内容
encoding：文件编码方式，不设置此选项， Pandas 默认使用 UTF-8 来解码。
index_col ，指定索引对应的列为数据框的行标签，默认 Pandas 会从 0、1、2、3 做自然排序分配给各条记录。
"""
import pandas as pd

path = r"C:\Users\lenovo\Desktop\pandas实验数据.xlsx"
#读取文件信息
result = pd.read_excel(path)
print(result)

#指定第一列为行索引
result = pd.read_excel(path,index_col=0)


#  默认读取第一个sheet，读取第2个sheet如下
result = pd.read_excel(path,index_col=0,sheet_name=1)

#读取某一列名
getinput = pd.read_excel('表路径',usecols=['Loadcase']) #Loadcase列名


# 查看指定前几行，默认前5行，指定行数写小括号里
result = pd.read_excel(path)
print(result.head())

# 查看数据的（行数、列数）
print(result.shape)

# 查看列索引列表
print(result.columns.values)
#
# # 查看行索引列表
print(result.index.values)

pandas写入excel

import pandas as pd
from pandas import DataFrame

#需要注意的是，当文件打开的时候是写不进去的

#**往文件中直接写入数据**
path = r"C:\Users\lenovo\Desktop\pandas实验数据.xlsx"
result = pd.DataFrame({'序号':[1,2,3],'姓名':['张三','李四','王五']})#数据为字典格式
result.to_excel(path,index=0) #index为行名索引,默认为True



#**或者这样写，即先把数据封装在一起**
dic1 = {'标题列1': ['张三','李四'],
        '标题列2': [80, 90]}
df = pd.DataFrame(dic1) #先将数据转换为DataFrame格式
df.to_excel(path, index=0,sheet_name="a") #再将数据写入excel中,同时可定义sheet的文件名


#**当同时写入多个sheet,以解决后面将前面的sheet覆盖的问题**
dic1 = {'标题列1': ['张三','李四'],
        '标题列2': [80, 90]}

dic2 = {'标题列3': ['王五','赵六'],
        '标题列4': [100, 110]}

dic3 = {'标题列5': ['孙七','周八'],
        '标题列6': [120, 130]}

df1 = pd.DataFrame(dic1) #先将其转换为DF格式
df2 = pd.DataFrame(dic2)
df3 = pd.DataFrame(dic3)

#需要先生成一个excel文件
df1.to_excel("text.xlsx",index=1,sheet_name="a") #index :布尔,默认的Ture，写行名（索引）

writer = pd.ExcelWriter(r"text.xlsx",mode= "a",engine= "openpyxl") #实例化ExcelWriter，其实我觉得直接放一个xlwt的文件路径也是没问题的

df2.to_excel(writer,index=1,sheet_name="b")
df3.to_excel(writer,index=1,sheet_name="c")
writer.save()
writer.close()

#**覆盖一个已经存在的sheet**
wb = writer.book
print(wb.sheetnames) #查看已存在的sheet的名字
wb.remove(wb["a"]) #删除sheet a
writer = pd.ExcelWriter(r"text.xlsx",mode= "a",engine= "openpyxl") #实例化ExcelWriter

df = pd.DataFrame({"name": ["夏色祭", "白上吹雪"]})
df.to_excel(writer, index=True, sheet_name="a")
writer.save()
writer.close()

posted @ 2022-03-21 22:36 小杨的冥想课阅读(602) 评论(0) 收藏举报

刷新页面返回顶部

小杨的冥想课

pandas操作excel的基础知识

pandas操作excel的基础知识

pandas读取excel

pandas写入excel

公告