摘要: 前提Hadoop环境已存在 下载:http://spark.apache.org/downloads.html 要根据自己机器中的hadoop版本选择对应的spark版本 Spark小知识:Spark会判断数剧处理时在哪个阶段要缓存数据,以及哪些数据应该缓存,有时候可能不会缓存数据,只是过滤一遍。 阅读全文
posted @ 2020-05-30 13:26 鱼丸河粉 阅读(243) 评论(0) 推荐(0) 编辑