02 2023 档案

摘要：

本篇先部署Apache Pulsar 最新版本2.11.0的 Locally Standalone，并通过创建Topic、生产消息和消费消息验证基础环境;接着通过二进制也即是所谓裸机部署方式一步步演示如何部署Pulsar的分布式集群，并通过Admin客户端验证基于租户、命名空间一些消息管理和使用简单功能。最后介绍Pulsar 层级存储的工作原理和使用场景，如何使用待续... 阅读全文

posted @ 2023-02-14 12:30 itxiaoshen 阅读(414) 评论(0) 推荐(0) 编辑

开源分布式支持超大规模数据分析型数据仓库Apache Kylin实践-下

摘要：

本篇先通过Kylin对连接条件、维度和度量限制的示例弄清Kylin的使用注意事项，在此基础上研究Kylin查询引擎，并配置spark查询下压实现没有cube的查询；理解Cube的构建优化，通过官方提供RestAPI实现动态灵活查询和cube构建，最后通过集成JDBC的Java代码实现简单查询操作。阅读全文

posted @ 2023-02-11 00:11 itxiaoshen 阅读(196) 评论(0) 推荐(0) 编辑

开源分布式支持超大规模数据分析型数据仓库Apache Kylin实践-上

摘要：

再下一城又一个实时多维交互式分析数仓利器，了解其特性和架构组成，进一步阐述相关概念和其生态圈；介绍作为开发测试最快捷方式的Docker单机部署；也基于Hadoop环境一步步部署最新v4.0.3二进制并解决遇到的问题，最后通过一个读取hive数据示例介绍kylin创建项目、选择数据源、创建Model、创建Cube、Cube的构建，全面认识kylin预计算查询强悍。阅读全文

posted @ 2023-02-09 23:42 itxiaoshen 阅读(444) 评论(0) 推荐(1) 编辑

大数据实时多维OLAP分析数据库Apache Druid入门分享-下

摘要：

了解Apache Druid的基础概念后，本篇进一步研究其核心架构和核心设计原理部分，了解相关外部依赖，对其数据摄取和查询有一定认识，然后通过搭建分布式集群进一步理解其架构组成，最后用一个示例从HDFS将数据摄取到Druid并演示两种查询方式阅读全文

posted @ 2023-02-01 23:39 itxiaoshen 阅读(422) 评论(2) 推荐(0) 编辑

公告

昵称： itxiaoshen
园龄： 3年7个月
粉丝： 53
关注： 1

+加关注

2025年2月

日

一

二

三

四

五

六

itxiaoshen博客

虽然不能成为技术大神，但也要与时俱进保持对于IT新技术的学习追求，一点点积累和自我总结，即使再小的帆也能远航。www.itxiaoshen.com

02 2023 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论