【Python自动化Excel】pandas处理Excel数据的基本流程
这里所说的pandas
并不是大熊猫,而是Python的第三方库。这个库能干嘛呢?它在Python数据分析领域可是无人不知、无人不晓的。可以说是Python世界中的Excel。
pandas库
处理数据相比于Excel,有一个极大的优点:数据
和处理逻辑
是分离的。基于这一点,便可以实现Excel数据处理的自动化,对于重复繁琐的数据分析,pandas
一次编写脚本便“终身受益”。反观Excel,遇到重复的任务还得一遍一遍地输入公式、拖动填充柄。
pandas处理Excel数据的基本流程#
从基本流程来看,这个数据处理过程,就是对原数据进行加工,生成新数据的过程。原始Excel文件
就像是原材料
,生成Excel文件
就像是新产品
。而pandas中就是这个加工厂,加工厂的处理逻辑就是根据具体需求来编写的代码。可以从下面的实例中来理解这过程。
实例演示#
实例需求描述:#
动图演示:#
pandas中的常用方法简介
一、读取Excel文件#
import pandas as pd
df = pd.read_excel(io,header=0)
常用参数介绍:
-
io
:需要传入Excel文件的路径。该参数没有默认值,不能为空 -
header
:可以指定从Excel中的哪一行开始读取数据。默认为0,从第一行开始。
二、数据处理#
DataFrame类型#
DataFrame
是pandas
库中的重要数据类型,可以叫做:数据框,好比放数据的架子,由行和列组成。其实跟Excel工作的表很类似,都是二维的。
DataFrame结构示意图
实际DataFrames数据表
筛选#
简单的数据筛选,只需要输入列名,也叫“键”
计算#
按照年龄分类:cut()函数#
三、写入Excel文件#
df.to_excel("./生成的Excel文件名.xlsx")
-
第一个参数:生成的Excel文件路径。
-
index
:生成的Excel文件中是否需要index列,默认为True
分类:
Python自动化办公
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!