随笔 - 54  文章 - 0  评论 - 6  阅读 - 67961

Druid对比Hadoop

Druid对比Hadoop

Hadoop 向世界证明, 花费很少的钱实现典型的解决方案, 将数据保存在一般的商用机器的数据仓库里是可行的. 当人们将自己的数据保存在Hadoop, 他们发现两个问题
    
    他们能够用一种相当灵活的方式查询数据来解答任何问题。
    这个查询花费很多时间

第一次运行Hadoop, 每个人都会感到高兴。 后面使用Hadoop进行交互性查询后, 他们意识到Hadoop只优化了吞吐量, 没有优化延时。

Druid完全是Hadoop的一个补充。 Hadoop精于存储和查询的大量的低价值个体数据.  不幸的是Hadoop不精于保证这些数据的查询时间, 也不善于提供为客户操作的特征。 相反Druid, 善于处理hadoop 只中低价值数据的汇总数据, 是查询汇总数据高效和高可用, 能够直接暴漏给客户使用。

Druid 需要基础设施提供深存储. HDFS 可以作为深存储的一种。

posted on   lpthread  阅读(2243)  评论(0编辑  收藏  举报
编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示