排除NaN值

df['内容'].dropna()

计算平均数

mean_ = df['age'].mean()

多个列的平均数

result = df[['age', 'height']].describe()
result.count().age  # 取值

groupby

result = df[['age', 'sex']].groupby('sex').mean()
# 方式二
result = df.groupby('sex')['age'].mean()

也可以多个列分组

result = df.groupby(['sex', 'origin'])['age'].mean()

每个类别的数量 value_counts()

value_count_ = df['笔记类型'].value_counts()
# 该函数是一个快捷方式，因为它实际上是一个groupby操作，结合了对每个组中记录数的计数
# value_count_ = df.groupby('笔记类型')['笔记类型'].count()

分组统计

按照一列的分组，统计另一列的值出现的次数

df['*市'].groupby(df['结束时间']).value_counts()

# 使用groupby在多列上的Value_counts
df = df.groupby(['城市', '结束时间']).agg({'网站名称': 'value_counts', '房屋用途': 'value_counts'})

posted on 2021-05-12 17:20 Rannie` 阅读(110) 评论(0) 收藏举报

刷新页面返回顶部

排除NaN值

计算平均数

多个列的平均数

groupby

每个类别的数量 value_counts()

分组统计

公告