2019年4月17日

大数据学习笔记5 - Spark

摘要: Spark是一个基于内存计算的大数据并行计算框架。所以,Spark并不能完全替代Hadoop,主要用于替代Hadoop中的MapReduce计算模型。 在实际应用中,大数据处理无非是以下几个类型: 复杂的批量数据处理,这种类型的处理时间跨度通常在数十分钟到数小时之间,处理这种数据的工具有Hadoop 阅读全文

posted @ 2019-04-17 10:34 at_today 阅读(203) 评论(0) 推荐(0) 编辑

导航