2012年5月9日
摘要: 问题背景:有一个用户留言板,留言在100字内,另外有一个滤词表,现在需要对用户留言进行过滤,清楚留言中出现并且出现在滤词表中的单词针对留言长度相对于滤词表单词而言较短,可采用如下滤词法1.构建滤词表的HashMap(filterMap)对滤词表中的每个单词做一次Hash,以Hash散列值作为Key,单词内容作为Value2.构建滤词表单词的起始符表和结束符表2.1起始符表将滤词表中每个单词的起始字符构建成一个表,作为起始符表(startList)2.2结束符表将滤词表中每个单词的结束字符构建成一个表,作为结束符表(endList)3.搜索留言敏感词1)从留言第一个字开始,与startList中 阅读全文
posted @ 2012-05-09 17:31 ZimZz 阅读(1241) 评论(0) 推荐(0) 编辑