例题2.40

例题2.40代码

import pandas as pd
import numpy as np
# 创建一个 DataFrame,其中包含 10 行 4 列的随机整数(1 到 5 之间),并添加一个名为 'A' 的随机列
np.random.seed(0)  # 设置随机种子以确保结果可复现
d = pd.DataFrame(np.random.randint(1, 6, (10, 3)), columns=list("BCD"))
d['A'] = np.random.randint(1, 3, 10)  # 添加一个名为 'A' 的随机列,这里假设有 1 和 2 两种可能的值

# 获取前4行数据
d1 = d[:4]

# 获取第5行以后的数据(注意 Python 是从 0 开始索引的,所以这里是第 4 行之后的所有行)
d2 = d[4:]

# 数据行合并(实际上,d1 和 d2 的合并就是 d 本身,但这里是为了演示)
dd = pd.concat([d1, d2])

# 数据分组求均值
s1 = d.groupby('A').mean()  # 现在 'A' 是一个有效的列名,可以用于分组

# 数据分组求和
s2 = d.groupby('A').sum()  # 同样,'A' 是一个有效的列名

# 打印结果以验证
print("原始 DataFrame:")
print(d)
print("\n合并后的 DataFrame:")
print(dd)
print("\n按 'A' 分组后的均值:")
print(s1)
print("\n按 'A' 分组后的和:")
print(s2)






posted @ 2024-10-22 22:16  等我刷把宗师  阅读(2)  评论(0编辑  收藏  举报