04 2015 档案
摘要:一、研究现状:【国外】文本校对最初是英文自动校对。其发展到今天,它的技术也相对成熟,并且出现了一批实用的商业系统。由于英文等拼音文字的文本中词与词之间有明显的分隔符,所以它们的自动校对基本以词的校对为核心在两个层次上进行: ①非词错误[3](non-word error)。即字串不是词典中存在的词。...
阅读全文
摘要:中国自然语言开源组织:http://www.nlpcn.org/(一)国家语委1国家语委现代汉语语料库http://www.cncorpus.org/现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000...
阅读全文
摘要:在谈N-Gram模型之前,我们先来看一下Mrkove假设: 1.一个词的出现仅仅依赖于它前面出现的有限的一个或者几个词; 2.一个词出现的概率条件地依赖于前N-1个词的词类。定义 N-Gram是大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM,ChineseL...
阅读全文
摘要:转自:http://www.gaobo.info/read.php/660.htm[c-sharp]view plaincopy//获取当前进程的完整路径,包含文件名(进程名)。stringstr=this.GetType().Assembly.Location;result:X:/xxx/xxx/...
阅读全文