2015年5月22日
摘要: 未完待续Introduction About Druid Design Concepts and Terminology White Paper Design docGetting Started Tutorial: A First Look at Druid Tutorial: The Druid... 阅读全文
posted @ 2015-05-22 17:32 lpthread 阅读(806) 评论(0) 推荐(0) 编辑
摘要: Redshift 内部使用了亚马逊取得了授权的ParAccel 实时注入数据 抛开可能的性能不同, 有功能性的不同Druid 适合分析大数据量的流式数据, 也能够实时加载和聚合数据一般来讲, 传统的数据仓库包括列式存储只摄入批量数据, 没有对流式数据做优化 Druid 是只读分析型数据仓库 Drui 阅读全文
posted @ 2015-05-22 17:05 lpthread 阅读(1594) 评论(0) 推荐(0) 编辑
摘要: 我们不是Elasticsearch的专家, 如果描绘有误, 请通过邮件列表或者其他途径告知我们. Elasticsearch 是基于Apache Lucene搜索服务器. 提供了对无模式文档的全文检索, 提供了存取未加工的事件记录功能。Elasticsearch也提供了分析和聚合功能。 据用户证明,... 阅读全文
posted @ 2015-05-22 16:15 lpthread 阅读(7582) 评论(0) 推荐(0) 编辑
摘要: Druid和Spark对比不是Spark专家, 如果描绘有错误, 请通过邮件列表或者其他方式告知我们Spark实现弹性的分布式数据集概念的计算集群系统, 可以看做商业分析平台。 RDDs能复用持久化到内存中的数据, 从而为迭代算法提供更快的计算速度。 这对一些工作流例如机器学习格外有用, 有些操作需... 阅读全文
posted @ 2015-05-22 16:14 lpthread 阅读(4716) 评论(0) 推荐(0) 编辑
摘要: Druid对比HadoopHadoop 向世界证明, 花费很少的钱实现典型的解决方案, 将数据保存在一般的商用机器的数据仓库里是可行的. 当人们将自己的数据保存在Hadoop, 他们发现两个问题 他们能够用一种相当灵活的方式查询数据来解答任何问题。 这个查询花费很多时间第一次运行Hadoop, 每... 阅读全文
posted @ 2015-05-22 16:12 lpthread 阅读(2240) 评论(0) 推荐(0) 编辑
摘要: 不是Cassandra专家, 如果描绘有错误, 请通过邮件列表或者其他方式告知, 我们会修正。Druid对扫描和聚合做了很大程度的优化, 不用提前计算就支持任意的向下钻取, 还可以实时摄入流式数据并实时查询这些进入的数据. Cassandra是很好的键值对数据仓库, 相对于纯粹的key-value数... 阅读全文
posted @ 2015-05-22 16:11 lpthread 阅读(1768) 评论(2) 推荐(0) 编辑
摘要: 怎么比较Druid和Vertica?Vertica 类似与之前介绍的ParAccel/Redshift(Druid-vs-Redshift). 不是实时注入数据; 提供SQL的全部语法支持另外一个很大不同是: Vertica 不适用index, 尝试利用run-length encoding和其他的... 阅读全文
posted @ 2015-05-22 16:07 lpthread 阅读(1639) 评论(0) 推荐(0) 编辑
摘要: Druid 和 Impala Shark 的对比取决于产品要求, 取决于系统是设计成做什么的Druid 被设计成 一直在线, 高可用性 实时插入数据 分片分块形式的任意查询据我所知 Impala 和 Shark 起初关心的是用更快的查询模块换Hadoop MapReduce, 查询模块是完全通用的,... 阅读全文
posted @ 2015-05-22 16:06 lpthread 阅读(4678) 评论(0) 推荐(0) 编辑