python 读取表格数据
python 读取表格数据
前言:
几种模块读取excel的区别:
pandas读取excel文件的时候内部会根据后缀名,调用xlrd或者openpyxl。xlrd侧重对excel的细节读取,大体上用pandas读取excel就比较OK。
demo:
import pandas as pd
data = pd.read_excel("file-name")
print(data)
此时data会变成 DataFrame类型,因此我们需要对DataFrame类型有些许了解
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔型值)。DataFrame既有行索引也有列索引,它可以被看做有Series组成的字典(共同用一个索引)。
详情可以查看菜鸟教程
要对数据进行处理,我们首先要了解这个DataFrame数据类型,有哪些好用的方法可以供我们是使用
名称 | 属性& 方法描述 |
---|---|
T | 行和列转置 |
axes | 返回一个仅以行轴标签和列轴标签为成员的列表 |
dtypes | 返回每列数据的数据类型 |
empty | DataFrame中没有数据或者任意坐标轴的长度为0,则返回True. |
ndim | 轴的数量,也指数组的维度 |
shape | 返回一个元组,表示DataFrame的维度,几行几列 |
size | DataFrame中的元素数量 |
values | 使用numpy数组表示DataFrame中的元素值 |
head() | 返回前n行数据 |
tail() | 返回后n行数据 |
shift() | 将行或列移动指定的步幅长度 |
想要深入了解DataFrame可以去看我写的另一篇,这里就不写的太详细了,不要耽误了读表格
读取前n行数据
import pandas as pd
data = pd.read_excel("file")
data_a = data.head(n) # 返回前n行数据 注意第一行数据会被当成标题不属于数据
print(data_a) # data_a 也是DataFrame类型
读取后n行数据
import pandas as pd
data = pd.read_excel("file")
data_b = data.tail(n)
print(data_b)
读取某列数据
import pandas as pd
data = pd.read_excel("file")
ls = []
# shape就是维度,shape[0]就是多少行,shape[1]就是多少列
for i in range(data.shape[0]):
# loc 主要根据dataFrame的行标和列表进行数据筛选
# values返回DataFrame的Numpy表示
ls.append(data.loc[i].values[n]) # n 代指某列的下标
# 实际操作中可以测试一下几种函数之间的区别
具体想要实现读取特定行、特定列的操作和二维数组操作比较接近
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)