摘要: ACL Anthology,囊括了ACL,EMNLP,CL等NLP领域重要会议和期刊的论文。http://www.aclweb.org/anthology-new/LDC: The Linguistic Data Consortiumhttp://www.ldc.upenn.edu/知网http:/... 阅读全文
posted @ 2015-02-04 18:35 Django's blog 阅读(292) 评论(0) 推荐(0) 编辑
摘要: http://www.blogjava.net/zhenandaci/archive/2008/06/05/205950.html学习方法:使用样例(或称样本,训练集)来合成计算机程序的过程称为学习方法[22]。监督学习:学习过程中使用的样例是由输入/输出对给出时,称为监督学习[22]。最典型的监督... 阅读全文
posted @ 2015-02-04 18:27 Django's blog 阅读(367) 评论(0) 推荐(0) 编辑
摘要: http://www.blogjava.net/zhenandaci/archive/2009/03/24/261701.html前文提到过,除了开方检验(CHI)以外,信息增益(IG,Information Gain)也是很有效的特征选择方法。但凡是特征选择,总是在将特征的重要程度量化之后再进行选... 阅读全文
posted @ 2015-02-04 18:25 Django's blog 阅读(953) 评论(0) 推荐(0) 编辑
摘要: http://www.blogjava.net/zhenandaci/archive/2008/08/31/225966.html前文提到过,除了分类算法以外,为分类文本作处理的特征提取算法也对最终效果有巨大影响,而特征提取算法又分为特征选择和特征抽取两大类,其中特征选择算法有互信息,文档频率,信息... 阅读全文
posted @ 2015-02-04 18:16 Django's blog 阅读(407) 评论(0) 推荐(0) 编辑
摘要: http://www.blogjava.net/zhenandaci/archive/2009/04/19/266388.html在文本分类的过程中,特征(也可以简单的理解为“词”)从人类能够理解的形式转换为计算机能够理解的形式时,实际上经过了两步骤的量化——特征选择阶段的重要程度量化和将具体文本转... 阅读全文
posted @ 2015-02-04 17:59 Django's blog 阅读(391) 评论(0) 推荐(0) 编辑
摘要: http://www.52nlp.cn/resources资源这里提供一些52nlp博客的一些系列文章以及收集的自然语言处理相关书籍及其他资源的下载,陆续整理中!如有不妥,我会做删除处理!特别推荐系列:1、HMM学习最佳范例全文文档,百度网盘链接:http://pan.baidu.com/s/1pJ... 阅读全文
posted @ 2015-02-04 15:19 Django's blog 阅读(369) 评论(0) 推荐(0) 编辑