pandas.DataFrame.sample和pandas.DataFrame.reset_index函数
pandas.DataFrame.sample-从DataFrame或Series对象中随机取样
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None, ignore_index=False)
常用的几个参数解释:
- n: 返回的项数。不能与frac一起使用。如果frac =None,则n默认值为1
- frac: 抽取比例,frac=1就是全部抽取
- replace: 抽样方式是有放回抽样还是无放回抽样。默认是无放回抽样
pandas.DataFrame.reset_index-重新设置DataFrame对象的index或level
DataFrame.reset_index(level=None, *, drop=False, inplace=False, col_level=0, col_fill='', allow_duplicates=_NoDefault.no_default, names=None)
几个常见参数解释:
- drop: 是否保留原有index。默认为False,表示保留原有index。
代码示例
import pandas as pd
df1=pd.DataFrame({"A":[2,3,4,6],"B":[7,9,8,5]})
print(df1,"\n")
print(df1.sample(frac=1).reset_index(drop=True))
输出结果
A B
0 2 7
1 3 9
2 4 8
3 6 5
A B
0 4 8
1 2 7
2 6 5
3 3 9
可以看到DataFrame对象的行标签(也就是index)发生了变化