上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 41 下一页
  2010年9月17日
该文被密码保护。 阅读全文
posted @ 2010-09-17 10:42 finallyly 阅读(4) 评论(0) 推荐(0) 编辑
  2010年9月13日
摘要: 很久以前自己整理的资料。由于文档太多就不放到博客园了。文档阅读地址:http://wenku.baidu.com/view/22af8d22bcd126fff7050b25.html资源整理参考了此篇博客:http://yanjinqing.blog.163.com/blog/static/97041620087542414443/在该博主工作的基础上,我进行了整理,添加,并删除了一些截图,并调节... 阅读全文
posted @ 2010-09-13 20:45 finallyly 阅读(6189) 评论(0) 推荐(0) 编辑
摘要: 一直让我困惑的问题是:abc与ca之间的编辑距离究竟等于几?问了很多同学和网友:大家的普遍观点是:如果在编辑距离定义中指明相邻交换操作为原子操作,那么应该等于2;反之,如果在编辑距离定义中为定义相邻交换操作为原子操作那么应该等于3。为了更好地阐明这个问题,先给出编辑距离的两种定义形式 1.Levenshtein distance(以下简称L氏距离)。 此距离由Levenshtein 于1965年定... 阅读全文
posted @ 2010-09-13 20:10 finallyly 阅读(5390) 评论(4) 推荐(0) 编辑
  2010年9月12日
摘要: 近日,在论坛发帖介绍自己的语料库。第一个版本的帖子内容如下:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html提供语料库下载链接第二个版本的帖子内容如下:我自己整理的一个中午新闻分类语料库,已经上传提供给和我一样对NLP狂热的业余爱好者下载。详情见http://www.cnblogs.com/finallyliuy... 阅读全文
posted @ 2010-09-12 14:51 finallyly 阅读(2508) 评论(0) 推荐(1) 编辑
摘要: 发信人: duckyaya (逃亡), 信区: NLP标 题: Re: 提供开源中文新闻文本分类语料库发信站: 水木社区 (Sun Sep 12 00:35:17 2010), 站内我以前也整理过一些http://www.scholarpedia.org/article/Text_categorization 涉及到文本分类的基本概念,存在的问题以及方向。http://www.cs.technio... 阅读全文
posted @ 2010-09-12 12:22 finallyly 阅读(969) 评论(0) 推荐(0) 编辑
  2010年9月11日
摘要: 注:博文转载、语料库使用,请注明提供者、来源以及空间提供方。免责声明:此语料库仅供自然语言处理的业余爱好者研究和交流,禁止用于任何商业用途(包括在资源内部链接广告等行为)。感谢网易新闻中心、腾讯新闻中心、凤凰新闻中心以及新浪新闻中心提供新闻素材。新闻著作权归以上网站所有,任何人未经上述公司允许不得抄袭。语料库下载地址: http://download.cnblogs.com/finallyliuyu/corpus.rar(注意:有网友提出要MSSQL2000数据库的MDF版本数据,这样在2000以上的数据库上可以进行附加。所以给出MDF,LDF格式的语料库下载地址:MDF版本语料库下载地址)语 阅读全文
posted @ 2010-09-11 19:28 finallyly 阅读(12270) 评论(23) 推荐(9) 编辑
摘要: http://www.zzsky.cn/build/content/1274.htm 阅读全文
posted @ 2010-09-11 15:25 finallyly 阅读(334) 评论(0) 推荐(0) 编辑
  2010年9月10日
摘要: 作者:finallyliuyu(注意:转载请标明作者和出处)献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之二题记: 做研究,尤其是基于统计学方法的研究,常常需要大量的训练数据。详细这些东西在读研究生不难得到。在自然语言处理公司工作的工作人员也不难得到。但是这些东西属于机密,实验室和公司是不会轻易外传的。所以对于业余的爱好者来说,比如园子里的(蛙蛙,overred)是很难得到详实的语料库的... 阅读全文
posted @ 2010-09-10 23:03 finallyly 阅读(12241) 评论(7) 推荐(4) 编辑
  2010年9月7日
摘要: 数值分析 最优化 算法 阅读全文
posted @ 2010-09-07 17:13 finallyly 阅读(278) 评论(0) 推荐(0) 编辑
  2010年9月6日
摘要: 最近研究特征词选择算法,主要在研究chi方统计量的方法。Christopher D Manning的书《信息检索导论》中(王斌译作191页,英文原版255页)的公式定义如下: 我所迷惑不解的是这个公式为啥长成这个样子?对于我还是略有了解的,比如X~n(0,1),那么X^2就服从chi-square, 独立 独立的chi方分布相加后仍然是chi squared 变量,并且自由度为各个加数自由度的和。... 阅读全文
posted @ 2010-09-06 22:12 finallyly 阅读(3022) 评论(6) 推荐(0) 编辑
上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 41 下一页