06 2020 档案

摘要:RDD是Spark中的核心数据模型,一个RDD代表着一个被分区(partition)的只读数据集。 RDD的生成只有两种途径: 一种是来自于内存集合或外部存储系统; 另一种是通过转换操作来自于其他RDD; 一般需要了解RDD的以下五个接口: partition 分区,一个RDD会有一个或者多个分区 阅读全文
posted @ 2020-06-19 21:18 龘人上天 阅读(138) 评论(0) 推荐(0) 编辑
摘要:Scala的解释器在解析函数参数(function arguments)时有两种方式: 传值调用(call-by-value):先计算参数表达式的值,再应用到函数内部; 传名调用(call-by-name):将未计算的参数表达式直接应用到函数内部 在进入函数内部前,传值调用方式就已经将参数表达式的值 阅读全文
posted @ 2020-06-18 10:29 龘人上天 阅读(404) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示