PySpark DataFrame选择某几行
1、collect():
print(dataframe.collect()[index])
2、dataframe.first()
3、dataframe.head(num_rows)、dataframe.tail(num_rows),head、tail配合使用可以取得中间指定位置的行
4、dataframe.select([columns]).collect()[index]
5、dataframe.take(num_rows),同head()方法
转自:https://www.geeksforgeeks.org/get-specific-row-from-pyspark-dataframe/