摘要: pip安装: wget https://bootstrap.pypa.io/get-pip.py python get-pip.py 阅读全文
posted @ 2018-05-30 17:36 Aemnprsu_wx 阅读(76) 评论(0) 推荐(0) 编辑
摘要: RDD(Resilient Distributed Dataset) 弹性分布式数据集 不可变的分布式对象集合,每个RDD被分为多个分区,分区运行在集群中的不同节点上。 1.创建方法: 1)读取外部数据集 2)驱动器程序里分发驱动器程序中的对象集合(list/set) 调用示例: import or 阅读全文
posted @ 2018-05-30 15:38 Aemnprsu_wx 阅读(123) 评论(0) 推荐(0) 编辑