10 2011 档案

Google的CityHash算法
摘要:在学数据结构的时候,大家一定学过散列表,但很多人不知道算列表有什么用,最后只知道做题,这也许就是教育的悲哀吧。 我开始也不知道,但是有一天,我学java的时候,用到了HashTable和HashSet的时候,就想到了散列表,网上查资料才发现散列表的巨大作用。 言归正传,今天我们来讨论一下字符串哈希算法。常用的简单又高效字符串哈希算有BKDRHash,APHash,DJBHash,JSHash,RS... 阅读全文

posted @ 2011-10-28 23:38 小橋流水 阅读(2534) 评论(0) 推荐(0) 编辑

NReadability
摘要:昨天写了一篇关于提取网页主题内容的文章,其中用到了一个叫SgmlReader将html标准化成xhtml格式的东西。今天在查询其相关信息的时候,发现了NReadability这个东东,发现这个东西也是提取网页主题内容的,发现效果貌似比我写的那个简单的要好很多。获取代码请访问github。 该工具中还带SgmlReader的源代码,可以说是很给力的,其中还为Xml Dom写了一些关于html Dom... 阅读全文

posted @ 2011-10-07 10:30 小橋流水 阅读(238) 评论(0) 推荐(0) 编辑

导航

统计

点击右上角即可分享
微信分享提示