第五章 大数据平台与技术 第12讲 大数据处理平台Spark
摘要:
Spark支持多种的编程语言 对比scala和Java编程上节课的计数程序。相比之下,scala简洁明了。 Hadoop的IO开销大导致了延迟高,也就是说任务和任务之间涉及到I/O操作。前一个任务完成之前没有写入硬盘,下一个任务无法从硬盘当中获取数据,从而导致了这个高延迟。 Spark与Hadoop 阅读全文
posted @ 2017-02-23 20:44 绿茵好莱坞 阅读(187) 评论(0) 推荐(0) 编辑