pandas.DataFrame.sample和pandas.DataFrame.reset_index函数
pandas.DataFrame.sample-从DataFrame或Series对象中随机取样
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None, ignore_index=False)
常用的几个参数解释:
- n: 返回的项数。不能与frac一起使用。如果frac =None,则n默认值为1
- frac: 抽取比例,frac=1就是全部抽取
- replace: 抽样方式是有放回抽样还是无放回抽样。默认是无放回抽样
pandas.DataFrame.reset_index-重新设置DataFrame对象的index或level
DataFrame.reset_index(level=None, *, drop=False, inplace=False, col_level=0, col_fill='', allow_duplicates=_NoDefault.no_default, names=None)
几个常见参数解释:
- drop: 是否保留原有index。默认为False,表示保留原有index。
代码示例
import pandas as pd
df1=pd.DataFrame({"A":[2,3,4,6],"B":[7,9,8,5]})
print(df1,"\n")
print(df1.sample(frac=1).reset_index(drop=True))
输出结果
A B
0 2 7
1 3 9
2 4 8
3 6 5
A B
0 4 8
1 2 7
2 6 5
3 3 9
可以看到DataFrame对象的行标签(也就是index)发生了变化
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义