随笔分类 -  #智能信息处理

大数据、人工智能、统计学习、自然语言处理等
只有注册用户登录后才能阅读该文。
posted @ 2015-05-01 12:26 mo_wang 阅读(27) 评论(0) 推荐(0) 编辑
摘要:中国自然语言开源组织:http://www.nlpcn.org/(一)国家语委1国家语委现代汉语语料库http://www.cncorpus.org/现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000... 阅读全文
posted @ 2015-04-21 17:02 mo_wang 阅读(11653) 评论(0) 推荐(1) 编辑
摘要:在谈N-Gram模型之前,我们先来看一下Mrkove假设: 1.一个词的出现仅仅依赖于它前面出现的有限的一个或者几个词; 2.一个词出现的概率条件地依赖于前N-1个词的词类。定义 N-Gram是大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM,ChineseL... 阅读全文
posted @ 2015-04-06 20:57 mo_wang 阅读(2478) 评论(0) 推荐(1) 编辑
只有注册用户登录后才能阅读该文。
posted @ 2015-04-06 13:10 mo_wang 阅读(34) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。
posted @ 2015-03-31 09:14 mo_wang 阅读(15) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。
posted @ 2015-03-30 23:46 mo_wang 阅读(5) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。
posted @ 2014-12-30 14:06 mo_wang 阅读(19) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。
posted @ 2014-10-28 15:57 mo_wang 阅读(11) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。
posted @ 2014-10-10 12:50 mo_wang 阅读(11) 评论(0) 推荐(0) 编辑