pandas dataframe常见使用场景大总结
pandas如何创建表dataframe并指定列名和值
import pandas as pd
data = pd.DataFrame([1,2,3,4],columns=['a', 'b', 'c','d'])
获取所有列名与行名
- 获取所有列名:
data.columns
- 获取所有行名:
data.index
,
注意:如果他们是字符串名字那就返回的是index对象。如需要变成列表使用代码data.index.tolist()
。如果没有名字默认是返回RangeIndex对象。
dataframe如何按多行名,按多列名筛选
# 筛选出行名为'行1'和'行2'的这两行
data = data.loc[['行1','行2'],:]
# 筛选出列名为'列1'和'列2'的这两列
data = data.loc[:,['列1','列2']]
dataframe根据列名按某列升序排序
data.sort_values(by=['列名'],ascending=True)
dataframe转存为csv文件(excel)
index=None表示不保存行号,header=None表示不保存表头
data.to_csv('./文件名.csv',index=None,header=None)
知乎 https://www.zhihu.com/people/yuanmuou/activities