2020年10月8日

nessie 安装&&简单试用

摘要: 以下是关于nessie基于容器的简单运行试用 环境准备 docker 运行 docker run -p 19120:19120 projectnessie/nessie 安装cli pip install pynessie 试用 创建分支 nessie create-branch my_branch 阅读全文

posted @ 2020-10-08 22:28 荣锋亮 阅读(476) 评论(0) 推荐(0) 编辑

nessie 类似git 管理数据湖

摘要: nessie 是由dremio团队开源的一个类似git 管理数据湖的系统方案 支持的特性 类似git 模式的版本管理 跨表事物(基于iceberg) 开放式的数据湖支持 参考资料 https://projectnessie.org/ https://www.dremio.com/introducin 阅读全文

posted @ 2020-10-08 15:53 荣锋亮 阅读(427) 评论(0) 推荐(0) 编辑

一些不错的开源大数据虚拟数据sql 查询引擎

摘要: 以下就是一个简单的整理,核心在数据sql查询以及支持的联邦数据处理上 presto 一个通用的sql on anything 工具 apache drill 很不错的多数据源sql 查询引擎,schema on fly dremio 很不错,从官方文档看有点对标presto,但是dremio 更强大 阅读全文

posted @ 2020-10-08 09:58 荣锋亮 阅读(1416) 评论(2) 推荐(0) 编辑

What Is a Data Lake Engine?

摘要: 转自:https://www.dremio.com/what-is-a-data-lake-engine/ A data lake engine is an open source software solution or cloud service that provides critical c 阅读全文

posted @ 2020-10-08 09:38 荣锋亮 阅读(229) 评论(0) 推荐(0) 编辑

导航