06 2020 档案
摘要:RDD是Spark中的核心数据模型,一个RDD代表着一个被分区(partition)的只读数据集。 RDD的生成只有两种途径: 一种是来自于内存集合或外部存储系统; 另一种是通过转换操作来自于其他RDD; 一般需要了解RDD的以下五个接口: partition 分区,一个RDD会有一个或者多个分区
阅读全文
摘要:Scala的解释器在解析函数参数(function arguments)时有两种方式: 传值调用(call-by-value):先计算参数表达式的值,再应用到函数内部; 传名调用(call-by-name):将未计算的参数表达式直接应用到函数内部 在进入函数内部前,传值调用方式就已经将参数表达式的值
阅读全文