2010年9月10日
摘要: 作者:finallyliuyu(注意:转载请标明作者和出处)献给热衷于自然语言处理的业余爱好者的中文新闻分类语料库之二题记: 做研究,尤其是基于统计学方法的研究,常常需要大量的训练数据。详细这些东西在读研究生不难得到。在自然语言处理公司工作的工作人员也不难得到。但是这些东西属于机密,实验室和公司是不会轻易外传的。所以对于业余的爱好者来说,比如园子里的(蛙蛙,overred)是很难得到详实的语料库的... 阅读全文
posted @ 2010-09-10 23:03 finallyly 阅读(12241) 评论(7) 推荐(4) 编辑