python 读取表格数据

前言：

几种模块读取excel的区别：

pandas读取excel文件的时候内部会根据后缀名，调用xlrd或者openpyxl。xlrd侧重对excel的细节读取，大体上用pandas读取excel就比较OK。

demo:

import pandas as pd

data = pd.read_excel("file-name")

print(data)

此时data会变成 DataFrame类型，因此我们需要对DataFrame类型有些许了解

DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值，字符串，布尔型值）。DataFrame既有行索引也有列索引，它可以被看做有Series组成的字典（共同用一个索引）。

详情可以查看菜鸟教程

要对数据进行处理，我们首先要了解这个DataFrame数据类型，有哪些好用的方法可以供我们是使用

名称	属性& 方法描述
T	行和列转置
axes	返回一个仅以行轴标签和列轴标签为成员的列表
dtypes	返回每列数据的数据类型
empty	DataFrame中没有数据或者任意坐标轴的长度为0，则返回True.
ndim	轴的数量，也指数组的维度
shape	返回一个元组，表示DataFrame的维度，几行几列
size	DataFrame中的元素数量
values	使用numpy数组表示DataFrame中的元素值
head()	返回前n行数据
tail()	返回后n行数据
shift()	将行或列移动指定的步幅长度

想要深入了解DataFrame可以去看我写的另一篇，这里就不写的太详细了，不要耽误了读表格

读取前n行数据

import pandas as pd

data = pd.read_excel("file")
data_a = data.head(n)  # 返回前n行数据 注意第一行数据会被当成标题不属于数据
print(data_a)          # data_a 也是DataFrame类型

读取后n行数据

import pandas as pd

data = pd.read_excel("file")
data_b = data.tail(n)
print(data_b)

读取某列数据

import pandas as pd

data = pd.read_excel("file")
ls = []
# shape就是维度，shape[0]就是多少行，shape[1]就是多少列
for i in range(data.shape[0]): 
    # loc 主要根据dataFrame的行标和列表进行数据筛选
    # values返回DataFrame的Numpy表示
    ls.append(data.loc[i].values[n]) # n 代指某列的下标
# 实际操作中可以测试一下几种函数之间的区别

具体想要实现读取特定行、特定列的操作和二维数组操作比较接近

posted @ 2022-09-29 09:28 十月的十日阅读(1421) 评论(0) 收藏举报

刷新页面返回顶部

Loading

luketebo

python 读取表格数据

python 读取表格数据

公告