秋华 - 博客园

2020年8月3日

摘要： 1 初识 Flink Flink 项目的理念是：“Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架”。 Apache Flink 是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算。Flink 被设计在所有常见的集群环境中运行，以内存执阅读全文

posted @ 2020-08-03 17:24 秋华阅读(871) 评论(0) 推荐(0) 编辑

Flink基础（一）：DS简介(1) 有状态的流式处理简介

摘要： 0 简介 Apache Flink是一个分布式流处理器，具有直观和富有表现力的API，可实现有状态的流处理应用程序。它以容错的方式有效地大规模运行这些应用程序。 Flink于2014年4月加入Apache软件基金会作为孵化项目，并于2015年1月成为顶级项目。从一开始，Flink就拥有一个非常活跃且阅读全文

posted @ 2020-08-03 17:16 秋华阅读(2093) 评论(0) 推荐(0) 编辑

2020年7月31日

Hbase基础（十三）：Kylin Cube构建优化

摘要：从之前章节的介绍可以知道，在没有采取任何优化措施的情况下，Kylin会对每一种维度的组合进行预计算，每种维度的组合的预计算结果被称为Cuboid。假设有4个维度，我们最终会有24 =16个Cuboid需要计算。但在现实情况中，用户的维度数量一般远远大于4个。假设用户有10 个维度，那么没有经过任何阅读全文

posted @ 2020-07-31 17:13 秋华阅读(576) 评论(0) 推荐(0) 编辑

Hbase基础（十二）：Kylin可视化

摘要：可以与Kylin结合使用的可视化工具很多，例如： ODBC：与Tableau、Excel、PowerBI等工具集成 JDBC：与Saiku、BIRT等Java工具集成 RestAPI：与JavaScript、Web网页集成 Kylin开发团队还贡献了Zepplin的插件，也可以使用Zepplin来访阅读全文

posted @ 2020-07-31 17:03 秋华阅读(816) 评论(0) 推荐(0) 编辑

Hbase基础（十一）：Kylin快速入门

摘要：需求：实现按照维度（工作地点）统计员工信息 1 数据准备在Hive中创建数据，分别创建部门和员工外部表，并向表中导入数据。（1）原始数据（2）建表语句创建部门表 create external table if not exists default.dept( deptno int, dna 阅读全文

posted @ 2020-07-31 16:51 秋华阅读(660) 评论(0) 推荐(0) 编辑

Hbase基础（十）：Kylin环境搭建

摘要： 1 安装地址 1）官网地址 http://kylin.apache.org/cn/ 2）官方文档 http://kylin.apache.org/cn/docs/ 3）下载地址 http://kylin.apache.org/cn/download/ 2 安装部署 1）将apache-kylin-2 阅读全文

posted @ 2020-07-31 16:28 秋华阅读(507) 评论(0) 推荐(0) 编辑

Hbase基础（九）：Kylin 概述

摘要： 1 Kylin定义 Apache Kylin是一个开源的分布式分析引擎，提供Hadoop/Spark之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBay Inc开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。 2 Kylin特点 Kylin的主要特点包括支持SQL 阅读全文

posted @ 2020-07-31 16:25 秋华阅读(957) 评论(0) 推荐(0) 编辑

Sqoop (3)：Sqoop 一些常用命令及参数

该文被密码保护。阅读全文

posted @ 2020-07-31 15:44 秋华阅读(230) 评论(0) 推荐(0) 编辑

Sqoop (2)：Sqoop 的简单使用案例

该文被密码保护。阅读全文

posted @ 2020-07-31 15:26 秋华阅读(191) 评论(0) 推荐(0) 编辑

Sqoop (1)：Sqoop 简介与原理、安装

该文被密码保护。阅读全文

posted @ 2020-07-31 15:18 秋华阅读(332) 评论(0) 推荐(0) 编辑

秋华

公告