上一页 1 ··· 311 312 313 314 315 316 317 318 319 ··· 376 下一页
摘要: 1 初识 Flink Flink 项目的理念是:“Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架”。 Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink 被设计在所有常见的集群环境中运行,以内存执 阅读全文
posted @ 2020-08-03 17:24 秋华 阅读(871) 评论(0) 推荐(0) 编辑
摘要: 0 简介 Apache Flink是一个分布式流处理器,具有直观和富有表现力的API,可实现有状态的流处理应用程序。它以容错的方式有效地大规模运行这些应用程序。 Flink于2014年4月加入Apache软件基金会作为孵化项目,并于2015年1月成为顶级项目。从一开始,Flink就拥有一个非常活跃且 阅读全文
posted @ 2020-08-03 17:16 秋华 阅读(2093) 评论(0) 推荐(0) 编辑
摘要: 从之前章节的介绍可以知道,在没有采取任何优化措施的情况下,Kylin会对每一种维度的组合进行预计算,每种维度的组合的预计算结果被称为Cuboid。假设有4个维度,我们最终会有24 =16个Cuboid需要计算。 但在现实情况中,用户的维度数量一般远远大于4个。假设用户有10 个维度,那么没有经过任何 阅读全文
posted @ 2020-07-31 17:13 秋华 阅读(576) 评论(0) 推荐(0) 编辑
摘要: 可以与Kylin结合使用的可视化工具很多,例如: ODBC:与Tableau、Excel、PowerBI等工具集成 JDBC:与Saiku、BIRT等Java工具集成 RestAPI:与JavaScript、Web网页集成 Kylin开发团队还贡献了Zepplin的插件,也可以使用Zepplin来访 阅读全文
posted @ 2020-07-31 17:03 秋华 阅读(816) 评论(0) 推荐(0) 编辑
摘要: 需求:实现按照维度(工作地点)统计员工信息 1 数据准备 在Hive中创建数据,分别创建部门和员工外部表,并向表中导入数据。 (1)原始数据 (2)建表语句 创建部门表 create external table if not exists default.dept( deptno int, dna 阅读全文
posted @ 2020-07-31 16:51 秋华 阅读(660) 评论(0) 推荐(0) 编辑
摘要: 1 安装地址 1)官网地址 http://kylin.apache.org/cn/ 2)官方文档 http://kylin.apache.org/cn/docs/ 3)下载地址 http://kylin.apache.org/cn/download/ 2 安装部署 1)将apache-kylin-2 阅读全文
posted @ 2020-07-31 16:28 秋华 阅读(507) 评论(0) 推荐(0) 编辑
摘要: 1 Kylin定义 Apache Kylin是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。 2 Kylin特点 Kylin的主要特点包括支持SQL 阅读全文
posted @ 2020-07-31 16:25 秋华 阅读(957) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2020-07-31 15:44 秋华 阅读(230) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2020-07-31 15:26 秋华 阅读(191) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2020-07-31 15:18 秋华 阅读(332) 评论(0) 推荐(0) 编辑
上一页 1 ··· 311 312 313 314 315 316 317 318 319 ··· 376 下一页