摘要:
Resilient Distributed Datasets Resilient Distributed Datasets ( RDD ) is a fundamental data structure of Spark. It is an immutable distributed collect 阅读全文
摘要:
看了一点《数据算法:Hadoop/Spark大数据处理技巧》,觉得有必要了解一下 Spark 。 以上。 Spark was introduced by Apache Software Foundation for speeding up the Hadoop computational compu 阅读全文
摘要:
变量的定义与赋值 Python 是动态语言,我们不需要为变量指定数据类型,只需要输入变量名和值就行了。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。 此外 Python 允许你同时为多个变量赋值。例如: 以上实例,创建一个整型对象,值为1,三个变量被分配到相同的内存空间上。 你甚至可以在 阅读全文