摘要: 一、virtualenv 安装 1、下载distribute_setup.py文件,文件压缩包下载完之后,放在以前安装Python的目录下就行。双击运行文件(双击之后cmd会打开之后闪退,就是安装成功)。 运行这个文件: 链接:https://pypi.python.org/packages/sou 阅读全文
posted @ 2021-01-18 22:33 喜欢爬的孩子 阅读(1039) 评论(0) 推荐(0) 编辑
摘要: 编程模型解释 RDD rdd.flatMap(_.split(" ")) .map((_, 1)) .reduceByKey(_ + _) .collect 针对自定义数据对象进行处理, 可以处理任意类型的对象, 比较符合面向对象 RDD 无法感知到数据的结构, 无法针对数据结构进行编程 DataF 阅读全文
posted @ 2021-01-18 17:01 喜欢爬的孩子 阅读(106) 评论(0) 推荐(1) 编辑