基于大规模语料的新词发现算法
摘要:作者: baiyuzhong 分类:选题策划 阅读:4,512 次 添加评论 文/顾森 对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未/结婚/的”呢? 这就是所谓的分词歧义难题。不过,现在很多语言模型都已能比较漂亮地解决这一问题了。但在中文分词领域里,还有一个比分词歧义更令人头疼的东西—— 未登录词。中文没有首字母大写,专名号也被取消...
阅读全文
posted @
2012-06-28 23:26
qqhfeng16
阅读(471)
推荐(0) 编辑
http://www.jb51.net/softjc/33896.html(vs2010破解)
摘要:http://www.jb51.net/softjc/33896.html
阅读全文
posted @
2012-06-06 05:12
qqhfeng16
阅读(1139)
推荐(0) 编辑