摘要:
Rule Based Optimizer(RBO)基于规则Cost Based Optimizer(CBO)基于成本,或者讲统计信息ORACLE 提供了CBO、RBO两种SQL优化器。CBO在ORACLE7 引入,但在ORACLE8i 中才成熟。ORACLE已经明确声明在ORACLE9i之后的版本中 阅读全文
摘要:
一、Presto Presto是Facebook开源的,完全基于内存的并⾏计算,分布式SQL交互式查询引擎是它被设计用来专门处理高速,实时的数据分析。Presto本身不存储数据,但是可以接入多种数据源,并且支持跨数据源的级联查询。与MySQL对比:MySQL首先是一个单点关系型数据库,其具有存储和计 阅读全文
摘要:
Spark和MapReduce都是用来处理海量数据,但是在处理方式和处理速度上却不同。第一,spark处理数据是基于内存的,而MapReduce是基于磁盘处理数据的。 MapReduce是将中间结果保存到磁盘中,减少了内存占用,牺牲了计算性能。 Spark是将计算的中间结果保存到内存中,可以反复利用 阅读全文
摘要:
Presto比Spark SQL更快或更慢,取决于您正在执行的查询类型,环境和引擎调整参数。 相同点 不同点 presto和spark sql都是MPP(massively parallel processing)架构(Presto/Impala/SparkSQL/Drill等), 有很好的数据量和 阅读全文