dremio cloud 分层datasets 实践
内容来自官方文档,主要是一种玩法
流程
- 底层或者第一层,主要包含物理数据集
- 第二层是虚拟数据集,属于一个基于上层进行了简单的数据加工处理(类型转换,字段重明),同时提供一些安全控制
- 第三层,用户进行数据的join 以及其他昂贵操作,此层属于数据密集操作,一般会包含数据反射的添加(原始反射以及聚合反射)
- 第四层,主要是帮助用户创建轻量级的虚拟数据集方便dashboard,resport 以及可视化工具,可以使用聚合反射(按需选择)
说明
dremio 官方推荐的此方法还是比较有用的,可以让我们更好的使用好dremio
参考资料
https://docs.dremio.com/cloud/data/datasets/#layering-datasets
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2021-02-26 dremio 配置文件
2021-02-26 cratedb 将完全开源
2020-02-26 一些pg fdw 版本过低的一些解决方法
2020-02-26 pgspider 一些ppt 截图
2020-02-26 postgres cassandra_fdw 扩展试用
2020-02-26 使用 postgres s3 fdw + cube.js 分析 csv 数据
2019-02-26 haproxy httpcheck with basic auth