Druid和Spark对比
Druid和Spark对比
不是Spark专家, 如果描绘有错误, 请通过邮件列表或者其他方式告知我们
Spark实现弹性的分布式数据集概念的计算集群系统, 可以看做商业分析平台。 RDDs能复用持久化到内存中的数据, 从而为迭代算法提供更快的计算速度。 这对一些工作流例如机器学习格外有用, 有些操作需要重复执行很多次才能达到结果的最终收敛。 Spark 提供了大量的算法用来查询和分析大量数据.
Druid 被设计成增强的分析应用, 重点关注注入数据和查询数据的延时问题。 如果你开发了WEB界面用于任意维度的探索查询数据, 会发现交互式查询Spark可能很慢。