例题2.40

例题2.40代码

import pandas as pd
import numpy as np
# 创建一个 DataFrame，其中包含 10 行 4 列的随机整数（1 到 5 之间），并添加一个名为 'A' 的随机列
np.random.seed(0)  # 设置随机种子以确保结果可复现
d = pd.DataFrame(np.random.randint(1, 6, (10, 3)), columns=list("BCD"))
d['A'] = np.random.randint(1, 3, 10)  # 添加一个名为 'A' 的随机列，这里假设有 1 和 2 两种可能的值

# 获取前4行数据
d1 = d[:4]

# 获取第5行以后的数据（注意 Python 是从 0 开始索引的，所以这里是第 4 行之后的所有行）
d2 = d[4:]

# 数据行合并（实际上，d1 和 d2 的合并就是 d 本身，但这里是为了演示）
dd = pd.concat([d1, d2])

# 数据分组求均值
s1 = d.groupby('A').mean()  # 现在 'A' 是一个有效的列名，可以用于分组

# 数据分组求和
s2 = d.groupby('A').sum()  # 同样，'A' 是一个有效的列名

# 打印结果以验证
print("原始 DataFrame:")
print(d)
print("\n合并后的 DataFrame:")
print(dd)
print("\n按 'A' 分组后的均值:")
print(s1)
print("\n按 'A' 分组后的和:")
print(s2)

posted @ 2024-10-22 22:16 等我刷把宗师阅读(2) 评论(0) 编辑收藏举报

刷新页面返回顶部

DENWOSHUABAZONGSHI

例题2.40

例题2.40代码

公告