2014年9月10日

未登录词识别

摘要: 未登录词识别:不在词典中的词---新词:杀马特---命名实体:奥克兰主要解决方案:基于规则合词,然后通过百度验证。Start Char Char 1-2-Combine #[图 n][里 f][市场 n][站 n]Start Char Char Char 1-3-Combine #Start Cha... 阅读全文

posted @ 2014-09-10 20:22 雨渐渐 阅读(1998) 评论(0) 推荐(0) 编辑

中文分词索引

摘要: 基本原理词典的存储基于规则的分词词性标注未登录词识别关键词提取:TF-IDF朴素贝叶斯文本分类 阅读全文

posted @ 2014-09-10 20:12 雨渐渐 阅读(280) 评论(0) 推荐(0) 编辑

基于语言模型最优路径搜索

摘要: 阅读全文

posted @ 2014-09-10 20:10 雨渐渐 阅读(171) 评论(0) 推荐(0) 编辑

导航