Python 中 Dataframe 的几种索引方式
创建一个示例数据框:
import pandas as pd
df = pd.DataFrame([['乔峰', '男', 95, '降龙十八掌', '主角'],
['虚竹', '男', 93, '天上六阳掌', '主角'],
['段誉', '男', 92, '六脉神剑', '主角'],
['王语嫣', '女', 95,'熟知武诀', '主角'],
['包不同', '男', 65, '胡搅蛮缠', '配角'],
['康敏', '女', 40, '惑夫妒人', '配角']],
index=list('abcdef'.upper()),
columns=['name', 'gender', 'score', 'skill', 'class'])
df
1、iloc[] # 列表取值方式索引器,只接受从 0 开始整数
2.loc[] # 字典取值方式的索引器,只接受 index 和 columns 的值
3、ix[] # 混合了 iloc 和 loc 的用法,整数和值都接受
4、[[]] # R语言 中的双中括号索引方式
5、字典形式索引列
6、属性形式索引列(列名称不是整数)
还有些切片、花哨索引、布尔掩码都先对简单,且都能在以上方式中应用,私以为不应单独列出。
pandas 的很多形式跟 R语言很是相似,颇值得玩味!
非学无以广才,非志无以成学。