博客园  :: 首页  :: 联系 :: 管理

随笔分类 -  Durid

摘要:IndexR是由舜飞科技研发的实时OLAP系统。于 2017 年 1 月初正式开源,目前已经更新至 0.6.1 版本,其作者认为IndexR具有以下特点: 超大数据集,低查询延时(超大数据集由HDFS保证,查询低延迟由MPP架构的Drill和IndexR专门设计的存储格式保证) 准实时 (和Drui 阅读全文

posted @ 2018-02-01 16:16 天戈朱 阅读(1640) 评论(1) 推荐(0) 编辑

摘要:谈到大数据,大家首先想到的肯定是Hadoop,近年来互联网技术的快速增长催生了各类大体量数据的爆发,Hadoop最大的贡献在于帮助企业将那些低价值的事件流数据转化为高价值的聚合数据,为企业的经营决策提供数据支撑。但Hadoop擅长的是存储和获取大规模数据,但是它并不提供任何性能上的保证。从这个角度来 阅读全文

posted @ 2017-07-16 14:37 天戈朱 阅读(5785) 评论(1) 推荐(0) 编辑

摘要:druid有三种类型的数据结构: timestamp列,维度列,指标列. 时间撮和指标在底层都是int数组或long数组. 指标值是int或long,而时间撮为long. Segment文件的内部结构可以看做是列式存储. 每一列的数据都是以不同的数据结果存储. 通过列式存储,查询时只查询需要的列可以 阅读全文

posted @ 2016-11-25 09:16 天戈朱 阅读(2207) 评论(1) 推荐(0) 编辑

摘要:Durid是在2013年底开源出来的,当前最新版本0.9.2, 主要解决的是对实时数据以及较近时间的历史数据的多维查询提供高并发(多用户),低延时,高可靠性的问题。对比Druid与其他解决方案,Kylin对数据按照分区每天构建前一天的cube数据提供给用户查询,用户查询的是历史数据。而Druid不断 阅读全文

posted @ 2016-11-22 05:35 天戈朱 阅读(8585) 评论(1) 推荐(4) 编辑

点击右上角即可分享
微信分享提示