python进行excel处理
1. Excel读取
# 首先导入pandas工具包 import pandas as pd # 读取Excel df = pd.read_excel('./excel_name.xlsx') # 相对路径,./表示当前文件夹上一级 df = pd.read_excel('E:\Python\01.大数据分析师\01.0418脱产班\009.python办公自动化\代码\代码\01_更快系列_1张Excel表拆成1000张表/excel_name.xlsx') # 绝对路径
2. Excel内容查看
df.shape # 数据规模查看 df.info() # 数据信息查看,确认数据数量,是否缺失以及数据类型 df.column_name.map(type).unique() # 确认列数据类型 df.column_name.map(type).value_counts() # 确认列数据数量 df.describe() # 查看数值型统计性信息,count/mean/max/min等 df.describe(include="all") # 查看所有数据统计性信息,包括非数值型 df[df.column_name == "item_name"] # 查看coulmn_name中项目为item_name的数据信息 df.column_name.unique() # 查看column_name列的信息(已去重) df.column_name.value_counts() # 统计column_name列所有项目数量 df.sort_values("coulmn_name", sacending=Flase)[0:10] # coulmn_name排序前10数据 df.insert(3, "coulmn_name3", df.coulmn_name1 * df.coulmn_name2) # 在数据第3列插入列名为coulmn_name1的列,其值为coulmn_name1 * coulmn_name2 df.groupby("coulmn_name1").get_group("item_name") # 查看coulmn_name1中item_name的数据信息 df[df.coulmn_name1.str.find("str_name") != -1] # 查看coulmn_name1中包含str_name字符的数据信息 df[df.coulmn_name1.str.contains("str_name")] # 同上 df[df.coulmn_name1.map(lambda x:"str_name" in x)] # 同上 df.groupby("coulmn_name1").sum().sort_values("coulmn_name2", ascengding=False) # 以coulmn_name1为分组项,求coulmn_name2的和并按coulmn_name2排序
3. Excel数据整理绘图
# 以coulmn_name1分组,求coulmn_name2之和前10数据信息纵向图Top10_coulmn_name2 = df.groupby("coulmn_name1)["coulmn_name2"].sum("coulmn_name2").sort_values(sdcending=False)[0:10] Top_coulmn_name2.plot(kind="barh")
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理