摘要: 根据官方文档,我们可以抽成以下的几个关键点: 1.hashCode的存在主要是用于查找的快捷性,如hashtable,hashMap等,hashCode是用来 在散列存储结构中确定对象的存储地址的 2.如果两个对象相同,就要适用于equals(java.lang.Object)方法,那么这两个对象的 阅读全文
posted @ 2017-01-11 21:58 蜗牛不爱海绵宝宝 阅读(249) 评论(0) 推荐(0) 编辑
摘要: 今天,我们就先聊一下spark中的DAG以及RDD的相关的内容 1.DAG:有向无环图:有方向,无闭环,代表着数据的流向,这个DAG的边界则是Action方法的执行 2.如何将DAG切分stage,stage切分的依据:有宽依赖的时候要进行切分(shuffle的时候, 也就是数据有网络的传递的时候) 阅读全文
posted @ 2017-01-11 00:12 蜗牛不爱海绵宝宝 阅读(4285) 评论(1) 推荐(1) 编辑