摘要: BloomFilter是一种高效的去重算法,算法的要义是散列对比。 1.原理 当一个元素加入集合时,判断这个元素是否 2.举例 例如我要对URL去重(这个在爬虫上可以用): URL1 -> 3.实现 阅读全文
posted @ 2019-04-19 08:44 yosql473 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 二叉树就是每个节点最多有两个分叉的树。这里我们写一写一个典型的例子二叉搜索树,它存在的实际意义是什么呢? 在P1.1链表中,我们清楚了链表的优势是善于删除添加节点,但是其取值很慢;数组的优势是善于取值,但是不利于删除添加节点。 而二叉搜索树,正是两者的折中方案。首先,它是树状结构,因此它便于插入和删 阅读全文
posted @ 2019-04-18 19:46 yosql473 阅读(233) 评论(0) 推荐(0) 编辑
摘要: * 注: 本文/本系列谢绝转载,如有转载,本人有权利追究相应责任。 栈是一种先进后出的结构(FILO),常见的操作有:push 入栈、pop删除栈顶元素并返回、peek 查看栈顶元素 与其他线性结构一样,栈的实现也有数组和链表两种形式。如何实现依据具体应用,例如栈的大小是确定的,那么使用数组实现开销 阅读全文
posted @ 2019-04-18 19:09 yosql473 阅读(202) 评论(0) 推荐(0) 编辑
摘要: * 注: 本文/本系列谢绝转载,如有转载,本人有权利追究相应责任。 2019年4月8日 D1.bloom filter D2.外部排序 D3.散列 D4.倒排索引 D5.Trie树 D6.多层划分 D7.位图 阅读全文
posted @ 2019-04-18 12:00 yosql473 阅读(93) 评论(0) 推荐(0) 编辑
摘要: * 注: 本文/本系列谢绝转载,如有转载,本人有权利追究相应责任。 2019年4月8日 Stan Zhang 2019年4月8日 格物致知,经世致用。 队列是一种先进先出FIFO的模型,常见操作有: push、pull 获得队列出口首元素并从队列中删除、peek 查看队列出口首元素,不从队列中删除。 阅读全文
posted @ 2019-04-18 11:32 yosql473 阅读(175) 评论(0) 推荐(0) 编辑
摘要: * 注: 本文/本系列谢绝转载,如有转载,本人有权利追究相应责任。 2019年4月8日 Stan Zhang 2019年4月8日 格物致知,经世致用。 [面试题]1.为什么要用链表? 数组具有的缺陷: 数组是长度固定类型固定的,并且它取值快,插入和删除慢。 链表正弥补了这样的不足,它是长度都可以灵活 阅读全文
posted @ 2019-04-18 08:52 yosql473 阅读(235) 评论(0) 推荐(0) 编辑
摘要: * 注: 本文/本系列谢绝转载,如有转载,本人有权利追究相应责任。 2019年4月8日 P1.1 链表 Link:https://www.cnblogs.com/yosql473/p/10727471.html over! P1.2 队列 Link:https://www.cnblogs.com/y 阅读全文
posted @ 2019-04-18 08:42 yosql473 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 注意: 本文不谈废话,低级问题请自行检查。 我使用Java版本的Kafka Producer生产数据,但是抛出了这个异常。百思不得其解,明明防火墙配置,ZooKeeper,Kafka配置都是没问题的啊。 困扰了我一天,最终发现这样一个问题: kafka.common.FailedToSendMess 阅读全文
posted @ 2019-04-17 12:08 yosql473 阅读(1765) 评论(0) 推荐(0) 编辑
摘要: 1.搭建Node.js环境 从官网下载安装 2.搭建Express环境 express 是 node.js的短精简的Web框架,官网:http://www.expressjs.com.cn/ 安装: npm install express -g #-g表示全局安装 -S = --save npm i 阅读全文
posted @ 2019-02-13 21:52 yosql473 阅读(2271) 评论(0) 推荐(0) 编辑
摘要: RDBMS迁移到HBase+Phoenix 阅读全文
posted @ 2018-11-03 14:47 yosql473 阅读(3227) 评论(0) 推荐(0) 编辑