pandas 学习笔记(1)

一、遍历数据:

1、for index,val in df.iterrows(): # 按行

2、for column ,val in df.items(): #按列

二、统计数据:

print((df == 0).astype(int).sum(axis=0)) #统计符合某个条件的数量

df.loc['hj'] = (df == 0).astype(int).sum(axis=0)

df = pd.DataFrame.from_dict(d,orient='index')

df = pd.DataFrame(pd.Series(d),columns=['value'])#字典创建Dataform

单条件筛选,例如查询gender为woman的数据:

1
df[df["gender"]=="woman"]# 或 df.loc[df["gender"]=="woman"]

使用isin()函数筛选,例如查询age为24、28的数据:

1
df[df["age"].isin([24,28])]

当有多个过滤条件时,可以使用逻辑操作符&|,如下。

例如:查询gender为“woman”并且city为“shanghai”的数据:

1
df[(df["gender"]=="woman") & (df["city"]=="shanghai")]

查询age大于25或者gender为“woman”的数据:

1
df[(df["age"]>25) | (df["gender"]=="woman")]

注意:逻辑操作符两边的过滤条件必须使用小括号()括起来,否则会报错或者不起作用。

波浪线符~可以取指定条件相反的数据,例如查询city不为“beijing”的数据:

1
df[~(df["city"]=="beijing")]

二、Dataframe数据遍历

如果要遍历 DataFrame 的行数据,需要使用以下方法:

iteritems()方法

python3 中换成items()

iteritems()方法是按列进行遍历,遍历结果为为(列名, value)键值对:

1
2
3
for column, value in df.iteritems():
    print(column)
    print(value)

iterrows()方法

 iterrows()方法是按行进行遍历,遍历结果为(index, value)键值对:

1
2
3
for index, row in df.iterrows():
    print(index)
    print(row)

itertuples()方法

itertuples()是以namedtuples(命名元组)形式遍历行,遍历每一行为一个命名元组:

1
2
for row in df.itertuples():
    print(row)<br>for line in data.itertuples():<br>  print<strong>(getattr</strong>(line, 'date'))
posted @   祺琪  阅读(16)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· AI 智能体引爆开源社区「GitHub 热点速览」
点击右上角即可分享
微信分享提示