04 2015 档案

摘要:一、研究现状:【国外】文本校对最初是英文自动校对。其发展到今天,它的技术也相对成熟,并且出现了一批实用的商业系统。由于英文等拼音文字的文本中词与词之间有明显的分隔符,所以它们的自动校对基本以词的校对为核心在两个层次上进行: ①非词错误[3](non-word error)。即字串不是词典中存在的词。... 阅读全文
posted @ 2015-04-23 09:54 mo_wang 阅读(6000) 评论(0) 推荐(1) 编辑
摘要:中国自然语言开源组织:http://www.nlpcn.org/(一)国家语委1国家语委现代汉语语料库http://www.cncorpus.org/现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000... 阅读全文
posted @ 2015-04-21 17:02 mo_wang 阅读(11726) 评论(0) 推荐(1) 编辑
摘要:在谈N-Gram模型之前,我们先来看一下Mrkove假设: 1.一个词的出现仅仅依赖于它前面出现的有限的一个或者几个词; 2.一个词出现的概率条件地依赖于前N-1个词的词类。定义 N-Gram是大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM,ChineseL... 阅读全文
posted @ 2015-04-06 20:57 mo_wang 阅读(2485) 评论(0) 推荐(1) 编辑
只有注册用户登录后才能阅读该文。
posted @ 2015-04-06 13:10 mo_wang 阅读(34) 评论(0) 推荐(0) 编辑
摘要:转自:http://www.gaobo.info/read.php/660.htm[c-sharp]view plaincopy//获取当前进程的完整路径,包含文件名(进程名)。stringstr=this.GetType().Assembly.Location;result:X:/xxx/xxx/... 阅读全文
posted @ 2015-04-03 11:41 mo_wang 阅读(174) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示