02 2023 档案

摘要:云原生时代顶流消息中间件Apache Pulsar部署实操-上本篇先部署Apache Pulsar 最新版本2.11.0的 Locally Standalone,并通过创建Topic、生产消息和消费消息验证基础环境;接着通过二进制也即是所谓裸机部署方式一步步演示如何部署Pulsar的分布式集群,并通过Admin客户端验证基于租户、命名空间一些消息管理和使用简单功能。最后介绍Pulsar 层级存储的工作原理和使用场景,如何使用待续... 阅读全文
posted @ 2023-02-14 12:30 itxiaoshen 阅读(414) 评论(0) 推荐(0) 编辑
摘要:开源分布式支持超大规模数据分析型数据仓库Apache Kylin实践-下本篇先通过Kylin对连接条件、维度和度量限制的示例弄清Kylin的使用注意事项,在此基础上研究Kylin查询引擎,并配置spark查询下压实现没有cube的查询;理解Cube的构建优化,通过官方提供RestAPI实现动态灵活查询和cube构建,最后通过集成JDBC的Java代码实现简单查询操作。 阅读全文
posted @ 2023-02-11 00:11 itxiaoshen 阅读(196) 评论(0) 推荐(0) 编辑
摘要:开源分布式支持超大规模数据分析型数据仓库Apache Kylin实践-上再下一城又一个实时多维交互式分析数仓利器,了解其特性和架构组成,进一步阐述相关概念和其生态圈;介绍作为开发测试最快捷方式的Docker单机部署;也基于Hadoop环境一步步部署最新v4.0.3二进制并解决遇到的问题,最后通过一个读取hive数据示例介绍kylin创建项目、选择数据源、创建Model、创建Cube、Cube的构建,全面认识kylin预计算查询强悍。 阅读全文
posted @ 2023-02-09 23:42 itxiaoshen 阅读(444) 评论(0) 推荐(1) 编辑
摘要:大数据实时多维OLAP分析数据库Apache Druid入门分享-下了解Apache Druid的基础概念后,本篇进一步研究其核心架构和核心设计原理部分,了解相关外部依赖,对其数据摄取和查询有一定认识,然后通过搭建分布式集群进一步理解其架构组成,最后用一个示例从HDFS将数据摄取到Druid并演示两种查询方式 阅读全文
posted @ 2023-02-01 23:39 itxiaoshen 阅读(422) 评论(2) 推荐(0) 编辑

点击右上角即可分享
微信分享提示