随笔 - 54 文章 - 0 评论 - 6 阅读 - 67961

Druid和Spark对比

Druid和Spark对比

不是Spark专家, 如果描绘有错误，请通过邮件列表或者其他方式告知我们

Spark实现弹性的分布式数据集概念的计算集群系统，可以看做商业分析平台。 RDDs能复用持久化到内存中的数据，从而为迭代算法提供更快的计算速度。这对一些工作流例如机器学习格外有用, 有些操作需要重复执行很多次才能达到结果的最终收敛。 Spark 提供了大量的算法用来查询和分析大量数据.

Druid 被设计成增强的分析应用，重点关注注入数据和查询数据的延时问题。如果你开发了WEB界面用于任意维度的探索查询数据，会发现交互式查询Spark可能很慢。

posted on 2015-05-22 16:14 lpthread 阅读(4719) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列：如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列：如何用 C#调用 C方法造成内存泄露

阅读排行：
· 无需6万激活码！GitHub神秘组织3小时极速复刻Manus，手把手教你使用OpenManus搭建本
· Manus爆火，是硬核还是营销？
· 终于写完轮子一部分：tcp代理了，记录一下
· 别再用vector＜bool＞了！Google高级工程师：这可能是STL最大的设计失误
· 单元测试从入门到精通

昵称： lpthread
园龄： 11年9个月
粉丝： 5
关注： 3

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

最新评论

1. Re:druid.io 海量实时OLAP数据仓库 (翻译+总结) (1)
你好，请问Druid或者别的数据库连接池，能否支持同一时刻有多个库可被连接到？比如，我的系统要同时访问Mysql的多个不同库，或要同时访问mysql和oracle？谢谢
--豆角茄子子
2. Re:AtomicReference 和 volatile 的区别
voliate能用于类变量吗？比如 voliate Student s
--放作夥
3. Re:druid.io 海量实时OLAP数据仓库 (翻译+总结) (1)
@ JallyZhang只翻译了这么多，还会翻译，但是会慢。...
--lpthread
4. Re:Druid对比Cassandra
@ wang#cassandra在CAP里面，取的是AP，舍的是C，注意：并不是完全不要C，而是要了一个弱化的C。...
--lpthread
5. Re:Druid对比Cassandra
Cassandra的一致性是可配置的，你可以根据业务对数据一致性的需求，配置不同的一致性级别，甚至可以为每个单独query设置一致性，而不需要对整个个Keyspace或者table配置一致性。
--wang#