摘要: Spark简介 Spark是基于内存的分布式批处理系统,它把任务拆分,然后分配到多个的CPU上进行处理,处理数据时产生的中间产物(计算结果)存放在内存中,减少了对磁盘的I/O操作,大大的提升了数据的处理速度,在数据处理和数据挖掘方面比较占优势。 Spark应用场景 数据处理(Data Process 阅读全文
posted @ 2021-01-14 23:04 夏日的向日葵 阅读(1569) 评论(0) 推荐(0) 编辑