摘要: 1.数据湖三足鼎立 https://cloud.tencent.com/developer/article/2397256 什么是数据湖? 集中的存储 多种格式的数据源无需结构化处理 不同类型的分析加工 为什么需要? lambda架构 基于hive的离线+基于kafka的实时 两条链路数据不一致 批 阅读全文
posted @ 2024-04-25 19:07 小花生hadoop 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 1. 整体架构 2. 安装部署 2.1 资源规划 实例名称 端口名称 默认端口 通信方式 说明 FE http_port 8030 -> 8034 用户/FE<--> FE FE上的http端口 web管理界面 BE webserver_port 8040 -> 8041 BE<-->FE BE上的 阅读全文
posted @ 2024-04-25 13:47 小花生hadoop 阅读(1295) 评论(0) 推荐(0) 编辑