会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
身带吴钩
博客园
首页
新随笔
联系
管理
订阅
2022年8月26日
pySpark RDD基本用法
摘要: pySpark RDD基本用法 RDD的全称是:Resilient Distributed Dataset (弹性分布式数据集),它有几个关键的特性: RDD是只读的,表示它的不可变性。 可以并行的操作分区集合上的所有元素。 每个RDD的内部,有5个主要特性: A list of partition
阅读全文
posted @ 2022-08-26 14:43 身带吴钩
阅读(679)
评论(0)
推荐(0)
编辑
公告