随笔分类 -  大数据 / spark离线计算

spark?
摘要:Apache Spark是一个用于大规模数据处理的快速、通用的计算引擎。是独立的分布式计算框架。 背景: Spark最初是作为一种替代Hadoop MapReduce的计算框架而开发的,也不使用Hadoop的文件系统或其他组件。Spark拥有自己的分布式存储系统(Spark RDD),可以直接从HD 阅读全文
posted @ 2023-04-10 23:52 黑逍逍 阅读(9) 评论(0) 推荐(0) 编辑




点击右上角即可分享
微信分享提示