随笔档案「2015年5月22日」：目录 ... - lpthread

2015年5月22日

摘要：未完待续Introduction About Druid Design Concepts and Terminology White Paper Design docGetting Started Tutorial: A First Look at Druid Tutorial: The Druid... 阅读全文

posted @ 2015-05-22 17:32 lpthread 阅读(811) 评论(0) 推荐(0)

Druid对比Redshift

摘要： Redshift 内部使用了亚马逊取得了授权的ParAccel 实时注入数据抛开可能的性能不同, 有功能性的不同Druid 适合分析大数据量的流式数据, 也能够实时加载和聚合数据一般来讲，传统的数据仓库包括列式存储只摄入批量数据，没有对流式数据做优化 Druid 是只读分析型数据仓库 Drui 阅读全文

posted @ 2015-05-22 17:05 lpthread 阅读(1621) 评论(0) 推荐(0)

Druid对比Elasticsearch

摘要：我们不是Elasticsearch的专家，如果描绘有误，请通过邮件列表或者其他途径告知我们. Elasticsearch 是基于Apache Lucene搜索服务器. 提供了对无模式文档的全文检索，提供了存取未加工的事件记录功能。Elasticsearch也提供了分析和聚合功能。据用户证明，... 阅读全文

posted @ 2015-05-22 16:15 lpthread 阅读(7619) 评论(0) 推荐(0)

Druid和Spark对比

摘要： Druid和Spark对比不是Spark专家, 如果描绘有错误，请通过邮件列表或者其他方式告知我们Spark实现弹性的分布式数据集概念的计算集群系统，可以看做商业分析平台。 RDDs能复用持久化到内存中的数据，从而为迭代算法提供更快的计算速度。这对一些工作流例如机器学习格外有用, 有些操作需... 阅读全文

posted @ 2015-05-22 16:14 lpthread 阅读(4749) 评论(0) 推荐(0)

Druid对比Hadoop

摘要： Druid对比HadoopHadoop 向世界证明，花费很少的钱实现典型的解决方案, 将数据保存在一般的商用机器的数据仓库里是可行的. 当人们将自己的数据保存在Hadoop，他们发现两个问题他们能够用一种相当灵活的方式查询数据来解答任何问题。这个查询花费很多时间第一次运行Hadoop, 每... 阅读全文

posted @ 2015-05-22 16:12 lpthread 阅读(2286) 评论(0) 推荐(0)

Druid对比Cassandra

摘要：不是Cassandra专家, 如果描绘有错误，请通过邮件列表或者其他方式告知, 我们会修正。Druid对扫描和聚合做了很大程度的优化，不用提前计算就支持任意的向下钻取, 还可以实时摄入流式数据并实时查询这些进入的数据. Cassandra是很好的键值对数据仓库，相对于纯粹的key-value数... 阅读全文

posted @ 2015-05-22 16:11 lpthread 阅读(1798) 评论(2) 推荐(0)

Druid对比Vertica

摘要：怎么比较Druid和Vertica?Vertica 类似与之前介绍的ParAccel/Redshift(Druid-vs-Redshift). 不是实时注入数据；提供SQL的全部语法支持另外一个很大不同是: Vertica 不适用index, 尝试利用run-length encoding和其他的... 阅读全文

posted @ 2015-05-22 16:07 lpthread 阅读(1661) 评论(0) 推荐(0)

Druid对比Impala/Shark

摘要： Druid 和 Impala Shark 的对比取决于产品要求，取决于系统是设计成做什么的Druid 被设计成一直在线，高可用性实时插入数据分片分块形式的任意查询据我所知 Impala 和 Shark 起初关心的是用更快的查询模块换Hadoop MapReduce, 查询模块是完全通用的，... 阅读全文

posted @ 2015-05-22 16:06 lpthread 阅读(4728) 评论(0) 推荐(0)