浅谈中文文本自动纠错在影视剧搜索中应用与Java实现
摘要:
1.背景: 这周由于项目需要对搜索框中输入的错误影片名进行校正处理,以提升搜索命中率和用户体验,研究了一下中文文本自动纠错(专业点讲是校对,proofread),并初步实现了该功能,特此记录。2.简介: 中文输入错误的校对与更正是指在输入不常见或者错误文字时系统提示文字有误,最简单的例子就是在word里打字时会有红色下划线提示。实现该功能目前主要有两大思路:(1) 基于大量字典的分词法:主要是将待分析的汉字串与一个很大的“机器词典”中的词条进行匹配,若在词典中找到则匹配成功;该方法易于实现,比较适用于输入的汉字串 属于某个或某几个领域的名词或名称;(2) 基于统计信息的分词法:常用的是... 阅读全文
posted @ 2012-12-21 23:52 巫峡 阅读(3458) 评论(5) 推荐(2) 编辑