统计excel中指定列的内容

生成样表

import pandas as pd

# 生成数据
data1 = {
    '姓名': ['张三', '李四', '王五'],
    '年龄': [25, 30, 35],
    '性别': ['男', '男', '女']
}

data2 = {
    '姓名': ['赵六', '钱七', '孙八'],
    '年龄': [40, 45, 50],
    '性别': ['男', '女', '男']
}

# 将数据转换为 DataFrame
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# 将 DataFrame 写入 Excel 文件,从第二行开始填充
with pd.ExcelWriter('data1.xlsx') as writer:
    df1.to_excel(writer, sheet_name='Sheet1', startrow=1, index=False)

with pd.ExcelWriter('data2.xlsx') as writer:
    df2.to_excel(writer, sheet_name='Sheet1', startrow=1, index=False)


遍历统计

import os
import pandas as pd

# 获取当前目录
directory = os.getcwd()

# 初始化一个空的 DataFrame 来存储汇总结果
summary_df = pd.DataFrame()

# 遍历目录中的所有文件
for filename in os.listdir(directory):
    if filename.endswith('.xlsx'):
        # 读取 Excel 文件
        df = pd.read_excel(os.path.join(directory, filename), skiprows=1)
        
        # 统计男女数量
        gender_count = df['性别'].value_counts()
        
        # 将统计结果添加到汇总 DataFrame 中
        summary_df[filename] = gender_count

# 将汇总结果写入到一个新的 Excel 文件中

summary_df.to_excel('summary.xlsx')
summary_df

posted @   redufa  阅读(18)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示