摘要: 是一种hash方法,其实核心思想就是,将一个字符串通过多个普通hash函数映射到hash表上,然后再进行检索的时候同样计算hash函数,如果全都都hash表上出现过,那么说明有极大的可能出现过,如果没有出现那么一定没有出现过。可以通过公式计算采取多少个普通hash函数和多大映射空间使正确率变得最低。... 阅读全文
posted @ 2015-10-16 16:28 chenhuan001 阅读(591) 评论(0) 推荐(0) 编辑
摘要: 最近在上计算机应用编程,老师给了一个大小为900MB的含20000000行邮箱地址的文件。 然后再给出了1000条查询数据,让你用字典树建树然后查询是否出现过。 试了下普通的tire树,特意用二进制写了下,结果才建了300000的时候就快用了2G内存,根本不行。 后面学习了下 PAT trie,发现 阅读全文
posted @ 2015-10-16 16:20 chenhuan001 阅读(608) 评论(0) 推荐(0) 编辑