PySpark DataFrame选择某几行

1、collect():

print(dataframe.collect()[index])

2、dataframe.first()

3、dataframe.head(num_rows)、dataframe.tail(num_rows),head、tail配合使用可以取得中间指定位置的行

4、dataframe.select([columns]).collect()[index]

5、dataframe.take(num_rows),同head()方法

转自:https://www.geeksforgeeks.org/get-specific-row-from-pyspark-dataframe/

posted @ 2021-10-28 16:54  morein2008  阅读(1205)  评论(0编辑  收藏  举报