python 读取表格数据

python 读取表格数据

前言:

几种模块读取excel的区别:

pandas读取excel文件的时候内部会根据后缀名,调用xlrd或者openpyxl。xlrd侧重对excel的细节读取,大体上用pandas读取excel就比较OK。

demo:

import pandas as pd

data = pd.read_excel("file-name")

print(data)

此时data会变成 DataFrame类型,因此我们需要对DataFrame类型有些许了解

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔型值)。DataFrame既有行索引也有列索引,它可以被看做有Series组成的字典(共同用一个索引)。

详情可以查看菜鸟教程

要对数据进行处理,我们首先要了解这个DataFrame数据类型,有哪些好用的方法可以供我们是使用

名称 属性& 方法描述
T 行和列转置
axes 返回一个仅以行轴标签和列轴标签为成员的列表
dtypes 返回每列数据的数据类型
empty DataFrame中没有数据或者任意坐标轴的长度为0,则返回True.
ndim 轴的数量,也指数组的维度
shape 返回一个元组,表示DataFrame的维度,几行几列
size DataFrame中的元素数量
values 使用numpy数组表示DataFrame中的元素值
head() 返回前n行数据
tail() 返回后n行数据
shift() 将行或列移动指定的步幅长度

想要深入了解DataFrame可以去看我写的另一篇,这里就不写的太详细了,不要耽误了读表格

读取前n行数据

import pandas as pd

data = pd.read_excel("file")
data_a = data.head(n)  # 返回前n行数据 注意第一行数据会被当成标题不属于数据
print(data_a)          # data_a 也是DataFrame类型

读取后n行数据

import pandas as pd

data = pd.read_excel("file")
data_b = data.tail(n)
print(data_b)

读取某列数据

import pandas as pd

data = pd.read_excel("file")
ls = []
# shape就是维度,shape[0]就是多少行,shape[1]就是多少列
for i in range(data.shape[0]): 
    # loc 主要根据dataFrame的行标和列表进行数据筛选
    # values返回DataFrame的Numpy表示
    ls.append(data.loc[i].values[n]) # n 代指某列的下标
# 实际操作中可以测试一下几种函数之间的区别

具体想要实现读取特定行、特定列的操作和二维数组操作比较接近

posted @   十月的十日  阅读(1396)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示
主题色彩