03 2021 档案

摘要:🧡先来一个问题,也是面试中常问的: Spark为什么会流行? 原因1:优秀的数据模型和丰富计算抽象 Spark 产生之前,已经有MapReduce这类非常成熟的计算系统存在了,并提供了高层次的API(map/reduce),把计算运行在集群中并提供容错能力,从而实现分布式计算。 虽然MapRedu 阅读全文
posted @ 2021-03-17 11:27 五分钟学大数据 阅读(2293) 评论(0) 推荐(0) 编辑
摘要:公众号(五分钟学大数据)已推出大数据面试系列文章—五分钟小面试,此系列文章将会深入研究各大厂笔面试真题,并根据笔面试题扩展相关的知识点,助力大家都能够成功入职大厂! 此面试题来自牛客网友分享的美团优选一面,面试时长一小时。网友情况:海外水本,在某三线中厂工作2年。 参考答案由本公众号提供。如有错误, 阅读全文
posted @ 2021-03-10 20:28 五分钟学大数据 阅读(1533) 评论(0) 推荐(1) 编辑
摘要:RDD算子调优 不废话,直接进入正题! 1. RDD复用 在对RDD进行算子时,要避免相同的算子和计算逻辑之下对RDD进行重复的计算,如下图所示: 对上图中的RDD计算架构进行修改,得到如下图所示的优化结果: 2. 尽早filter 获取到初始RDD后,应该考虑尽早地过滤掉不需要的数据,进而减少对内 阅读全文
posted @ 2021-03-05 17:03 五分钟学大数据 阅读(843) 评论(1) 推荐(1) 编辑
摘要:公众号(五分钟学大数据)已推出大数据面试系列文章—五分钟小面试,此系列文章将会深入研究各大厂笔面试真题,并根据笔面试题扩展相关的知识点,助力大家都能够成功入职大厂! 大数据笔面试系列文章分为两种类型:混合型(即一篇文章中会有多个框架的知识点—融会贯通);专项型(一篇文章针对某个框架进行深入解析—专项 阅读全文
posted @ 2021-03-04 09:24 五分钟学大数据 阅读(273) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示