DW004 - ArgoDB介绍
ArgoDB:自主可控、国际领先、一站式满足湖仓集一体化建设的创新型分布式分析数据库
一、产品特点
- 统一的SQL编译引擎:支持标准SQL,兼容Teradata,Oracle,Db2等方言,应用开发门槛低,应用迁移改动少。
- SQL支持:
- 支持ANSI 9/2003
- 兼容Teradata、Oracle、DB2等多种数据库方言
- 兼容多种SQL存储过程:Oracle PL/SQL,DB2 PL/SQL,Teradata宏语法
- 事务支持(ACID)
- 具备完整的事务支持能力(全事务隔离级别支持,包括读未提交、读已提交、可重复读、串行化)
- 数据类型
- 数值类型:字符类型、日期类型、布尔类型、大对象类型(blob\clob)等
- 操作符:数值运算、逻辑运行、比较运算、字串拼接(类型强转)等
- 函数:数值函数、字符函数、日期函数、类型转换、条件表达式、聚合函数、窗口分析函数等
- 其他:支持表空间、支持临时表、支持索引、支持视图、支持sequence、支持游标……
- SQL支持:
- 统一的SQL计算引擎:基于SSD存储优化的列式存储,结合向量化执行,可实现万亿数据关联分析秒级响应,带来百倍性能的提升。
- 列式存储:对简单查询、复杂查询、Ad-hoc查询有很好的适应性和更高的性能。
- 行式存储:增量文件采用行存方式存储。
- 向量化执行引擎
- 优化迭代执行模式为一次处理一批元组,减少IO开销
- 与列存完美结合,快速装载向量化的列数据
- 负载动态感知优化器:动态调整执行计划,自适用task数量,减少任务执行开销,提升稳定性,性能提升20%+
- 功能亮点1:自适应task数调整(调高稳定性,提升性能)
- 自适应task数量调整机制:能够在SQL执行期间动态调整task数,将执行时间较少的task进行合并。
- 减少任务执行开销,减少任务数量,提升稳定性
- 在数据插入时,减少小文件数量
- 性能提升:性能平均提升20%;当Task数>>CPU核数,且shuffle数据较小时,性能至多提升5倍以上
- 功能亮点2:运行时join算法自调整(提升性能)
- 运行时Join算法调整机制:能够自动识别Join过程中的大小表,选择最佳的Join优化算法,自动把Common Join转换为Map Join,从而大大提升Join效率。
- 功能亮点3:Bucket Join优化(提升性能)
- 能够根据表的属性(例如小文件个数、分桶个数、分桶文件大小)进行计算,自动识别判断是否应该使用bucket join。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南