pandas 分组 抽样

复制代码
import pandas as pd

data = pd.read_csv("data.csv")
grouped_data = data.groupby("Group")

sampled_data = grouped_data.apply(pd.DataFrame.sample, n=200, random_state=42)

#拆分训练集和测试集
delete_index = [i[1] for i in sampled_data.index]

train = data[~data.index.isin(delete_index)]
train

train[['MD','label']].sample(frac=1).to_csv('train.csv',index=False)

test = sampled_data
test[['MD']].sample(frac=1).to_csv('test.csv',index=False)
复制代码

 

posted @   cup_leo  阅读(74)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示