摘要:
pip安装: wget https://bootstrap.pypa.io/get-pip.py python get-pip.py 阅读全文
摘要:
RDD(Resilient Distributed Dataset) 弹性分布式数据集 不可变的分布式对象集合,每个RDD被分为多个分区,分区运行在集群中的不同节点上。 1.创建方法: 1)读取外部数据集 2)驱动器程序里分发驱动器程序中的对象集合(list/set) 调用示例: import or 阅读全文