DW004 - ArgoDB介绍

 

ArgoDB:自主可控、国际领先、一站式满足湖仓集一体化建设的创新型分布式分析数据库

 

一、产品特点

  • 统一的SQL编译引擎:支持标准SQL,兼容Teradata,Oracle,Db2等方言,应用开发门槛低,应用迁移改动少。
    • SQL支持:
      • 支持ANSI 9/2003
      • 兼容Teradata、Oracle、DB2等多种数据库方言
      • 兼容多种SQL存储过程:Oracle PL/SQL,DB2 PL/SQL,Teradata宏语法
    • 事务支持(ACID)
      • 具备完整的事务支持能力(全事务隔离级别支持,包括读未提交、读已提交、可重复读、串行化)
    • 数据类型
      • 数值类型:字符类型、日期类型、布尔类型、大对象类型(blob\clob)等
      • 操作符:数值运算、逻辑运行、比较运算、字串拼接(类型强转)等
      • 函数:数值函数、字符函数、日期函数、类型转换、条件表达式、聚合函数、窗口分析函数等
    • 其他:支持表空间、支持临时表、支持索引、支持视图、支持sequence、支持游标……
  • 统一的SQL计算引擎:基于SSD存储优化的列式存储,结合向量化执行,可实现万亿数据关联分析秒级响应,带来百倍性能的提升。
    • 列式存储:对简单查询、复杂查询、Ad-hoc查询有很好的适应性和更高的性能。
    • 行式存储:增量文件采用行存方式存储。
    • 向量化执行引擎
      • 优化迭代执行模式为一次处理一批元组,减少IO开销
      • 与列存完美结合,快速装载向量化的列数据
  • 负载动态感知优化器:动态调整执行计划,自适用task数量,减少任务执行开销,提升稳定性,性能提升20%+
    • 功能亮点1:自适应task数调整(调高稳定性,提升性能)
    • 自适应task数量调整机制:能够在SQL执行期间动态调整task数,将执行时间较少的task进行合并。
      • 减少任务执行开销,减少任务数量,提升稳定性
      • 在数据插入时,减少小文件数量
      • 性能提升:性能平均提升20%;当Task数>>CPU核数,且shuffle数据较小时,性能至多提升5倍以上
    • 功能亮点2:运行时join算法自调整(提升性能)
      • 运行时Join算法调整机制:能够自动识别Join过程中的大小表,选择最佳的Join优化算法,自动把Common Join转换为Map Join,从而大大提升Join效率。
    • 功能亮点3:Bucket Join优化(提升性能)
      • 能够根据表的属性(例如小文件个数、分桶个数、分桶文件大小)进行计算,自动识别判断是否应该使用bucket join。

 

posted @ 2023-10-29 14:14  HOUHUILIN  阅读(5)  评论(0编辑  收藏  举报