随笔分类 -  数据虚拟化

上一页 1 2 3 4 5 6 ··· 22 下一页

dremio dbt 升级到1.7 版本了
摘要:就在最近dremio dbt 包升级到1.7了,兼容dbt -core 1.7 特性了,以前是基于1.5的 说明 dbt 新版本还是有不少新特性的,对于升级版本后边尝试试用下 参考资料 https://github.com/dremio/dbt-dremio/releases/tag/v1.7.0 阅读全文

posted @ 2024-05-08 11:58 荣锋亮 阅读(16) 评论(0) 推荐(0) 编辑

dremio 新的logback 日志配置自动reload 功能简单说明
摘要:dremio 25.0 版本对于logback 的日志配置支持自动reload 了,不需要重启服务了,功能上看似乎很高级,实际上只是利用了logback 的能力,以下简单说明下 新添加的配置 logback.xml <configuration scan="true" scanPeriod="30 阅读全文

posted @ 2024-05-08 08:00 荣锋亮 阅读(21) 评论(0) 推荐(0) 编辑

dremio dbt 集成nessie分支扩展说明
摘要:dremio dbt 的集成我以前简单说过玩法,同时与nessie 的集成也有说明过(主要是关于配置以及简单使用的) 以下我说明下nessie 分支特性集成的一些可能玩法 nessie 分支简单说明 nessie 基于元数据的分支特性可以很好的辅助我们进行数据模型的开发,而且不需要多份数据,可以使用 阅读全文

posted @ 2024-05-07 09:43 荣锋亮 阅读(17) 评论(0) 推荐(0) 编辑

dremio AuthProvider 简单说明
摘要:AuthProvider 是在authenticator 模块中提供的接口定义,目前实现包括了LocalUsernamePasswordAuthProvider以及DremioAccessTokenAuthProviderLocalUsernamePasswordAuthProvider 是目前社区 阅读全文

posted @ 2024-05-07 08:00 荣锋亮 阅读(10) 评论(0) 推荐(0) 编辑

dremio UserService 简单说明
摘要:以前是简单说明过dremio 的UserService ,dremio 实际上支持内部以及外部用户的玩法 类图 可以看到,包含了simple 以及executor 两个,同时实现了UserServiceEvents 支持发布订阅能力的接口(订阅是25.0 版本的) executor 的实现实际上是为 阅读全文

posted @ 2024-05-05 08:00 荣锋亮 阅读(9) 评论(0) 推荐(0) 编辑

dremio 数据集自动提升处理简单说明
摘要:dremio 对于数据集自动提升可以通过ui,也可以通过sql,当然rest api 也是可以的,目前sql 使用起来相对简单,但是缺少一些配置参数 sql 模式参考命令 // 当前推荐的模式 ALTER TABLE s3.dalong.demo REFRESH METADATA AUTO PROM 阅读全文

posted @ 2024-05-04 08:00 荣锋亮 阅读(19) 评论(0) 推荐(0) 编辑

dremio 读取 jsonl 格式支持
摘要:实际上属于dremio 社区一个问题,内部实际上是dremio 对于格式化插件支持的问题, 不少是基于文件格式硬编码的,尽管 我们可以自定义格式化插件,但是对于已经支持的就有点不是很方便了,可以直接复用现有的,以下说明下修改以及处理 直接修改JSONFormatPlugin 代码支持jsonl 参考 阅读全文

posted @ 2024-05-02 11:31 荣锋亮 阅读(15) 评论(0) 推荐(0) 编辑

使用@lakehouse-rs/flight-sql-client nodejs api 快速访问dremio 服务
摘要:@lakehouse-rs/flight-sql-client 是基于rust 开发的node arrow flight sql client ,dremio 目前也是推荐基于arrow flight sql 的访问模式 参考代码 package.json { "name": "node-arrow 阅读全文

posted @ 2024-05-01 08:37 荣锋亮 阅读(14) 评论(0) 推荐(0) 编辑

dremio 日志配置
摘要:dremio 对于日志的配置支持基于系统属性以及环境变量的模式,对于环境变量实际上也是使用的系统属性 参考配置 系统属性 可以直接通过dremio-env 文件添加 -Ddremio.log.path=/opt/dremio/logs 环境变量 直接添加环境变量就可以了 DREMIO_LOG_DIR 阅读全文

posted @ 2024-04-30 11:44 荣锋亮 阅读(11) 评论(0) 推荐(0) 编辑

dremio The source [xxxx] is currently unavailable. Metadata is not accessible; please check node health简单说明
摘要:最近在dremio 25.0 版本碰到了一些问题,以下说明下原因以及处理 问题现象 问题 实际上此问题是执行节点报的错误,并不是协调节点的,早期一直以为是协调节点的,结果通过分析调试发现是协调节点报的错误 The source [xxxx] is currently unavailable. Met 阅读全文

posted @ 2024-04-29 08:36 荣锋亮 阅读(43) 评论(0) 推荐(0) 编辑

dremio 25.0 KVStore 升级简单说明
摘要:dremio 25.0 开始对于数据源的存储支持加密了,所以升级上稍有不同,官方给出的操作流程如下 参考处理 // 对于已经运行的,应该先stop,然后进行应用包的替换 dremio stop // 执行dremio-admin 的upgrade dremio-admin upgrade // 启动 阅读全文

posted @ 2024-04-27 08:00 荣锋亮 阅读(17) 评论(0) 推荐(0) 编辑

dremio datastore简单说明二
摘要:以前也介绍过dremio 的datastore,目前软件版主要是基于rocksdb 的kv,对于创建会基于一个的集群角色使用不同的 dremio 实际包含了好几类的KVStoreProvider 参考KVStoreProvider实现子类 可以看到包含了local,remote,trace,noop 阅读全文

posted @ 2024-04-26 08:00 荣锋亮 阅读(20) 评论(0) 推荐(0) 编辑

dremio 25.0 maven ce 依赖官方已经发布
摘要:以前写过如何基于软件包的jar 实现maven 依赖的重构,目前官方ce 依赖的包已经发布了,可以直接使用了 参考资料 https://www.cnblogs.com/rongfengliang/p/18129848 阅读全文

posted @ 2024-04-20 07:16 荣锋亮 阅读(21) 评论(0) 推荐(0) 编辑

dremio dbt ref 内部处理简单说明
摘要:dremio dbt 内部对于ref 进行了重写,可以实现一些灵活的扩展 参考处理 ref 参考实现 dbt/include/dremio/macros/builtins/builtins.sql 对于ref 进行了一些调整,可以进行一些自定义操作,核心是对于模型格式化的定义 {%- macro r 阅读全文

posted @ 2024-04-20 00:16 荣锋亮 阅读(18) 评论(0) 推荐(0) 编辑

dremio dbt 模型处理简单说明
摘要:dremio dbt adapter 在设计的时候与传统adapter 稍有不同,比如里边调整了database 名称的处理,同时因为dremio 的特殊性 对于物化的处理是先物化然后创建一个视图(table 模式的) 对于我们实际使用到的数据是在dremio 的space (或者nessie 数据 阅读全文

posted @ 2024-04-19 06:59 荣锋亮 阅读(24) 评论(0) 推荐(0) 编辑

dremio SchemaMutability 简单说明
摘要:dremio SchemaMutability 属于一个枚举,定义了schema 的可变性能力() 参考定义 public enum SchemaMutability { @Tag(1) ALL(true, true, true, true), @Tag(2) NONE(false, false, 阅读全文

posted @ 2024-04-18 11:49 荣锋亮 阅读(9) 评论(0) 推荐(0) 编辑

dremio FormatCreator 简单说明
摘要:FormatCreator 的核心职责就是进行Format plugin 的创建 核心提供的能力 如下图,目前核心是为FileSystemPlugin 提供格式化处理的能了(包含了格式识别,数据预览,格式插件查找,创建格式插件) 构造函数初始化 默认是基于了动态类发现以及加载进行系统FormatPl 阅读全文

posted @ 2024-04-17 19:49 荣锋亮 阅读(18) 评论(0) 推荐(0) 编辑

dremio No enum constant com.dremio.common.types.TypeProtos.MinorType.TIMESTAMPMICRO 问题简单说明
摘要:现象 此问题一般出现了我们对于数据源的物理表进行了反射(源表包含时间戳类型的数据),但是我们希望直接使用反射里边的parquet 文件格式数据,此时使用预览默认是可以读取parquet 数据的,但是当我们实际查询的时候发现可能提示此问题 参考异常调用链 VALIDATION ERROR: No en 阅读全文

posted @ 2024-04-17 19:48 荣锋亮 阅读(15) 评论(0) 推荐(0) 编辑

dremio 一个元数据刷新问题
摘要:以前关于dremio 元数据刷新的也简单介绍过,最近发现dremio 新版本(从24.1 版本开始)有一些调整,废弃了,所有数据集的刷新配置 只支持基于查询的元数据刷新,一些关于此调整一些说明 好处 减少了元数据刷新的时间以及对于查询的影响,可以让查询阶段的元数据处理更快了(核心是减少查询处理) 减 阅读全文

posted @ 2024-04-17 00:15 荣锋亮 阅读(35) 评论(0) 推荐(0) 编辑

基于dremio 安装包进行源码依赖包maven 私服重建的一个思路
摘要:dremio 25.0 版本已经发布了,但是如果希望自己源码构建,但是缺少一些依赖造成编译会有问题,但是我们可以直接基于官方提供的 下载包的文件进行maven 私服的重建,以下说明下简单流程 参考流程 下载软件包 这个可以从dremio 官网下载到 最好选择一个可以构建的分支本地构建下 此步骤的目的 阅读全文

posted @ 2024-04-11 18:29 荣锋亮 阅读(61) 评论(7) 推荐(0) 编辑

上一页 1 2 3 4 5 6 ··· 22 下一页

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示