miwaiwai

导航

2024年1月7日 #

spark-cdh学习

摘要: Spark: 1.Apache Spark是用于大规模数据处理的统一分析引擎 2.一款分布式内存计算的分析引擎 源数据层: 1.sdk日志埋点 2.日志文件:爬虫日志,业务日志 3.关系型数据库:mysql,oracle等 数据采集层: 1.离线:flume,sqoop,Nifi 2.实时:file 阅读全文

posted @ 2024-01-07 22:39 米歪歪 阅读(19) 评论(0) 推荐(0) 编辑