摘要: Resilient Distributed Datasets Resilient Distributed Datasets ( RDD ) is a fundamental data structure of Spark. It is an immutable distributed collect 阅读全文
posted @ 2017-08-18 23:19 archeroc 阅读(280) 评论(0) 推荐(0) 编辑
摘要: 看了一点《数据算法:Hadoop/Spark大数据处理技巧》,觉得有必要了解一下 Spark 。 以上。 Spark was introduced by Apache Software Foundation for speeding up the Hadoop computational compu 阅读全文
posted @ 2017-08-18 19:44 archeroc 阅读(230) 评论(0) 推荐(0) 编辑
摘要: 变量的定义与赋值 Python 是动态语言,我们不需要为变量指定数据类型,只需要输入变量名和值就行了。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。 此外 Python 允许你同时为多个变量赋值。例如: 以上实例,创建一个整型对象,值为1,三个变量被分配到相同的内存空间上。 你甚至可以在 阅读全文
posted @ 2017-08-18 11:29 archeroc 阅读(265) 评论(0) 推荐(0) 编辑