摘要: Storm上游数据源之Kakfa 目标: 理解Storm消费的数据来源、理解JMS规范、理解Kafka核心组件、掌握Kakfa生产者API、掌握Kafka消费者API。对流式计算的生态环境有深入的了解,具备流式计算项目架构的能力。 大纲: 1、 kafka是什么? 2、 JMS规范是什么? 3、 为 阅读全文
posted @ 2019-04-08 17:59 烽火连城516 阅读(1431) 评论(0) 推荐(0) 编辑
摘要: 1. Hive基本概念 1.1 Hive简介 1.1.1 什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 1.1.2 为什么使用Hive 面临的问题 人员学习成本太高 项目周期要求太短 我只是需要一个简单的环境 Map 阅读全文
posted @ 2019-04-08 17:37 烽火连城516 阅读(1336) 评论(0) 推荐(0) 编辑