会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
zwtgyh
I wish you could keep your hope forever, and your faith.
博客园
首页
新随笔
联系
订阅
管理
2020年5月22日
hadoop常用操作指南
摘要:
阅读全文
posted @ 2020-05-22 20:27 zwtzz
阅读(176)
评论(0)
推荐(0)
编辑
基于pyspark的mapreduce实现
摘要: 假设有数据量T级名为data的RDD,需要做一些列动作,一般需要使用map-reduce,其中map阶段可以使用def函数或者lambda形式,返回新的RDD,reduce可以起到累加作用,例: 1 from pyspark import SparkConf 2 conf = SparkConf()
阅读全文
posted @ 2020-05-22 14:49 zwtzz
阅读(1483)
评论(0)
推荐(0)
编辑