2022年2月26日

apache pinot 学习

摘要: apache pinot 是一个很不错的olap 服务,功能强大,低延迟,包含了实时以及离线处理 支持的特性 非常快(支持离线以及实时处理) 水平扩展(基于了apache helix 框架) 插件化索引,包含sorted index,bitmap index,invertes index, star 阅读全文

posted @ 2022-02-26 22:34 荣锋亮 阅读(597) 评论(0) 推荐(0) 编辑

pinot jdbc 连接池工具使用说明

摘要: apache pinot 是一个很不错高性能的实时分析工具,同时提供了sql 查询能力,官方的jdbc 就是基于rest 包装的sql 查询 目前的问题 官方是基于sql +rest api (java client) 进行的jdbc 驱动开发,对于一些不支持的特性直接会跑出异常,这些很容易造成 好 阅读全文

posted @ 2022-02-26 18:30 荣锋亮 阅读(220) 评论(0) 推荐(0) 编辑

dremio job 处理流程参考

摘要: 内容来自官方文档,可以了解dremio对于job 的处理 参考图 流程图 说明 上图还是比较有意义的,可以了解dremio内部的一些处理机制,以及状态转换,同时官方文档也包含了job的性能参数 参考资料 https://docs.dremio.com/cloud/querying-data/jobs 阅读全文

posted @ 2022-02-26 14:51 荣锋亮 阅读(59) 评论(0) 推荐(0) 编辑

dremio cloud 分层datasets 实践

摘要: 内容来自官方文档,主要是一种玩法 流程 底层或者第一层,主要包含物理数据集 第二层是虚拟数据集,属于一个基于上层进行了简单的数据加工处理(类型转换,字段重明),同时提供一些安全控制 第三层,用户进行数据的join 以及其他昂贵操作,此层属于数据密集操作,一般会包含数据反射的添加(原始反射以及聚合反射 阅读全文

posted @ 2022-02-26 14:33 荣锋亮 阅读(52) 评论(0) 推荐(0) 编辑

dremio cloud 参考说明

摘要: 最近dremio 官方网站调整了,ui 看着舒服多了,同时也提供了cloud的介绍 参考架构 从机制上与snowflake 比较类似 dremio cloud 包含的对象 一个tree ,维护dremio 的基础数据以及vds,datasource 说明 dremio cloud 看着还是很强大的, 阅读全文

posted @ 2022-02-26 14:21 荣锋亮 阅读(59) 评论(0) 推荐(0) 编辑

dremio yarn 资源调度配置简单说明

摘要: 以前简单说过一些关于yarn 运行的,对于在yarn 资源调度框架运行,dremio 需要的配置还是比较多的## 配置简单说明 配置需要三大步骤,hadoop配置,dremio runtime 配置,yarn 调度资源配置,以下主要说明关于dremio 相关的 协调节点 services: { co 阅读全文

posted @ 2022-02-26 11:44 荣锋亮 阅读(61) 评论(0) 推荐(0) 编辑

导航