pandas中的随机排序和抽样

1.随机重排序

使用take()随机排序

如:

df.take([54])   #采取索引为54的数据

 

可以借助np.random.permutation()函数随机排序

permutation()函数是指产生0~n-1的所有整数的随机排列

如:对索引为0~10的数据进行随机排序

df.take(np.random.permutation(10))

(部分)

 

2.随机抽样:

当dataframe样本数据足够多时,对数据进行随机采样。

方法一:

使用np.random.randint()配合take()函数进行随机抽样

方法二:

使用sample(n)函数

n:是采样个数。

格式:df.sample(n)

 

posted @ 2019-01-15 21:20  石桥浪子  阅读(3228)  评论(0编辑  收藏  举报