dremio map 数据查询

官方提供了具体的操作说明,可以很好的体验dremio 对于map 的使用,内容来自官方文档

数据生成

  • 使用pyarrow
import pyarrow as pa
import pyarrow.parquet as pq
 
description = ["Dictionary", "Dress", "Wagon"]
 
properties = [
    [("Cover", "Hardcover"), ("Publication Year", "2002"), ("Color", "Blue")],
    [("Size", "Medium"), ("Color", "Red")],
    [("Material", "Metal"), ("Color", "Red")],
]
 
assert len(description) == len(properties)
maparr = pa.array(properties, type=pa.map_(pa.string(), pa.string()))
table = pa.table([description, maparr], names=["description", "properties"])
pq.write_table(table, "products.parquet")
  • 查询效果

 

 

支持的操作

包含了size,map_keys, map_values, typeof 等,还是比较有用的,同时也支持基于属性key 的数据过滤

与struct 的区别

map 只能是基本类型,同时map 所有的值类型必须是一样的

说明

从测试来看map 的属性是不区分大小写的,同时注意目前是从23 版本才开始支持的,迁移的老版本需要进行元数据的刷新

参考资料

https://www.dremio.com/blog/introducing-map-data-type-in-dremio/

posted on   荣锋亮  阅读(44)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2020-10-27 imgproxy 强大高效的图片处理服务
2020-10-27 java 使用js 引擎处理业务逻辑
2020-10-27 nodejs java 互调用
2019-10-27 dolt 基于git协议的数据管理工具
2019-10-27 docz 强大简单的文档管理工具
2019-10-27 yugabyte 安装pg extention
2018-10-27 hasura graphql-engine v1.0.0-alpha26 版本新功能试用

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示