drill 学习 一 drill 基本介绍
drill 是一个大数据sql 查询引擎(当然对于hdf也是支持写入的,我们的主要场景还是数据查询)
drill 支持的数据格式
drill 支持的数据格式较多,以下是一个简单的说明
- csv,tsv,psv或者其他任意用分隔符字段的数据(当然我们可以自己配置数据解析——通过存储插件配置选项)
- json (bjson也是可以的,比如mongo)
- parrquet
- avro
- hadoop sequcen
- apache 以及nginx 日志分析,内置了的数据解析函数
- 日志文件(基于内置的通用函数)
- pcap/pcap-ng 网络数据包抓包文件(libpcap,比如wireshark抓包数据)
支持的存储系统
- hbase
- hive
- kafaka
- mapr-db
- mongo
- opentsdb
- 主流基于jdbc驱动的关系型数据库
分布式文件系统的支持
- hdfs
- s3 (s3 兼容的都可以,minio很不错)
- mapr-fs
特性
- 简单易用
可以支持主流的数据库,同时我们可方便的集成主流的bi工具(可以通过jdbc连接drill,drill 就可以类似一个数据库引擎了,但是drill不是数据库引擎) - no schema
drill 不像其他需要写时schema,而且在运行时自己决定的(类似读时schema,但是也不是,因为drill并不需要定义任何,都是自动的),当然也是有
代价的,我们可能会有因为数据规范的问题,造成查询失败(尤其是在处理mongo多变数据的时候)
drill 性能
drill 大量水用了内存数据缓存以及cpu 优化,并通过网络进行数据交换,所以对于内存以及cpu 资源情况可能会有比较大的影响(jvm 配置也是很重要的)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)