2020年2月6日

spark学习第五天

摘要: map(t => t.split(",")(0))表示:lines这个RDD中每个元素被split()函数拆分成3个字符串,保存到数组中,然后,把数组中的第1个元素(即学生名字字段的值)取出来放到新的RDD中。 distinct()表示:去重操作,即把重复的学生名字去掉,只保留一个。 count() 阅读全文

posted @ 2020-02-06 21:48 哈弗h6 阅读(117) 评论(0) 推荐(0) 编辑

导航