摘要: NLP中常用的PTB语料库,全名Penn Treebank。Penn Treebank是一个项目的名称,项目目的是对语料进行标注,标注内容包括词性标注以及句法分析。语料来源为:1989年华尔街日报语料规模:1M words,2499篇文章语料价格:1500 ~ 1700$Penn Treebank委... 阅读全文
posted @ 2014-12-16 22:31 MindProbe 阅读(7456) 评论(1) 推荐(0) 编辑