it_worker365

   ::  ::  ::  ::  :: 管理

2017年5月11日

摘要: 构建在HDFS之上的分布式,面向列的存储系统,使用zookeeper做协同服务,在需要实时读写和随机访问超大规模数据集的时候使用 缺点:非关系型,不支持SQL,数据类型单一(字符串,无类型),之支持单行事物 优点:大(上亿行,百万列),面向列/列簇的存储和控制权限,稀疏存储(对于NULL列不占空间) 阅读全文
posted @ 2017-05-11 15:08 it_worker365 阅读(304) 评论(0) 推荐(0) 编辑

摘要: 数据写入方式 1. update-in-place原地更新 2. append-only btree/copy on write tree顺序文件末尾追加 数据被按照特定方式放置,提升读性能,但写性能下降,对b+树和hash更新时需要随机读写: 1. 二分查找,将文件数据有序保存,使用二分查找来完成 阅读全文
posted @ 2017-05-11 13:44 it_worker365 阅读(2637) 评论(0) 推荐(0) 编辑

摘要: /** * Created by itworker365 on 5/11/2017. * * 堆结构可以视为一颗完全二叉树,除了最后一层节点其余都是满的,所以可算出parent(i)=i/2 leftchild(i)=2*i rightchild=2*i + 1 * 因为根节点的值都大于两个子节点,因为其子女节点的序号都大于n,所以n/2 + 1 ~ n都是叶节点,因此构建堆就在1 ... 阅读全文
posted @ 2017-05-11 10:50 it_worker365 阅读(186) 评论(0) 推荐(0) 编辑

摘要: 1. 基于LinkedHashMap 2. 基于HashMap 和 双向链表 阅读全文
posted @ 2017-05-11 10:21 it_worker365 阅读(190) 评论(0) 推荐(0) 编辑