上一页 1 ··· 256 257 258 259 260 261 262 263 264 ··· 270 下一页
摘要: 可以看c++实现: https://github.com/mavam/libbf python实现:https://github.com/jaybaird/python-bloomfilter 转自:http://www.cnblogs.com/dolphin0520/archive/2012/11 阅读全文
posted @ 2016-12-23 16:52 bonelee 阅读(503) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.cnblogs.com/haippy/archive/2012/07/13/2590351.html 布隆过滤器[1](Bloom Filter)是由布隆(Burton Howard Bloom)在1970年提出的。它实际上是由一个很长的二进制向量和一系列随机映射函数组成 阅读全文
posted @ 2016-12-23 16:15 bonelee 阅读(3496) 评论(1) 推荐(0) 编辑
摘要: 转自:https://my.oschina.net/u/2982571/blog/775452 设计背景 百度的链接处理系统每天处理万亿级的超链数据,在过去,这是一系列Mapreduce的批量过程,对时效性收录很不友好。在新一代搜索引擎架构设计中,我们采用流式、增量处理替代了之前的批量、全量处理。链 阅读全文
posted @ 2016-12-22 16:24 bonelee 阅读(2939) 评论(0) 推荐(0) 编辑
摘要: C: Consistency 一致性 • A: Availability 可用性(指的是快速获取数据) • P: Tolerance of network Partition 分区容忍性(分布式) 10年前,Eric Brewer教授指出了著名的CAP理论,后来Seth Gilbert 和 Nanc 阅读全文
posted @ 2016-12-22 16:00 bonelee 阅读(1718) 评论(0) 推荐(0) 编辑
摘要: Greenplum数据库基于PostgreSQL开源技术。本质上讲,它是多个PostgreSQL实例一起充当一个数据库管理系统。Greenplum以PostgreSQL 8.2.15为基础构建,在SQL支持、特性、配置选项和终端用户功能方面非常像PostgreSQL,用户操作Greenplum就跟平 阅读全文
posted @ 2016-12-22 15:48 bonelee 阅读(2255) 评论(0) 推荐(0) 编辑
摘要: 现实中很多数据都是用图来表达的,比如社交网络中人与人的关系、地图数据、或是基因信息等等。RDBMS并不适合表达这类数据,而且由于海量数据的存在,让其显得捉襟见肘。NoSQL数据库的兴起,很好地解决了海量数据的存放问题,图数据库也是NoSQL的一个分支,相比于NoSQL中的其他分支,它很适合用来原生表 阅读全文
posted @ 2016-12-22 14:59 bonelee 阅读(35845) 评论(0) 推荐(3) 编辑
摘要: You are given two linked lists representing two non-negative numbers. The most significant digit comes first and each of their nodes contain a single 阅读全文
posted @ 2016-12-21 23:06 bonelee 阅读(402) 评论(0) 推荐(0) 编辑
摘要: Given n pairs of parentheses, write a function to generate all combinations of well-formed parentheses. For example, given n = 3, a solution set is: c 阅读全文
posted @ 2016-12-21 22:37 bonelee 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.cnblogs.com/haippy/archive/2011/12/04/2276064.html 有时间再好好看下整个文章! 说起LevelDb也许您不清楚,但是如果作为IT工程师,不知道下面两位大神级别的工程师,那您的领导估计会Hold不住了:Jeff Dean和S 阅读全文
posted @ 2016-12-21 17:38 bonelee 阅读(2824) 评论(0) 推荐(0) 编辑
摘要: 注意两个地方说法有出入,待实测! es可以根据磁盘使用情况来决定是否继续分配shard。默认设置是开启的,也可以通过api关闭:cluster.routing.allocation.disk.threshold_enabled: false 在开启的情况下,有两个重要的设置: cluster.rou 阅读全文
posted @ 2016-12-21 12:07 bonelee 阅读(6709) 评论(0) 推荐(0) 编辑
上一页 1 ··· 256 257 258 259 260 261 262 263 264 ··· 270 下一页