发信人: duckyaya (逃亡), 信区: NLP
标 题: Re: 提供开源中文新闻文本分类语料库
发信站: 水木社区 (Sun Sep 12 00:35:17 2010), 站内
我以前也整理过一些
http://www.scholarpedia.org/article/Text_categorization
涉及到文本分类的基本概念,存在的问题以及方向。
http://www.cs.technion.ac.il/~gabr/resources/atc/atcbib.html
涉及到文本分类的历年文章
http://techtc.cs.technion.ac.il/
用于文本分类的ODP数据集
http://web.ist.utl.pt/~acardoso/datasets/
经过处理的单类别文本分类数据集
http://www.cs.umass.edu/~mccallum/code-data.html
http://zeddius.spaces.live.com/blog/cns!2916695FA7B7532B!538.entry
其他数据集总结的
很久没做文本分类了,呵呵。
【 在 finallyliuyu (原地转圈的驴子) 的大作中提到: 】
: 下载地址见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html
--
I'm overboard, And I need your love
Pull me up, I can't swim on my own
It's too much
Feels like I'm drowning without your love
So throw yourself out to me, my life saver
标 题: Re: 提供开源中文新闻文本分类语料库
发信站: 水木社区 (Sun Sep 12 00:35:17 2010), 站内
我以前也整理过一些
http://www.scholarpedia.org/article/Text_categorization
涉及到文本分类的基本概念,存在的问题以及方向。
http://www.cs.technion.ac.il/~gabr/resources/atc/atcbib.html
涉及到文本分类的历年文章
http://techtc.cs.technion.ac.il/
用于文本分类的ODP数据集
http://web.ist.utl.pt/~acardoso/datasets/
经过处理的单类别文本分类数据集
http://www.cs.umass.edu/~mccallum/code-data.html
http://zeddius.spaces.live.com/blog/cns!2916695FA7B7532B!538.entry
其他数据集总结的
很久没做文本分类了,呵呵。
【 在 finallyliuyu (原地转圈的驴子) 的大作中提到: 】
: 下载地址见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html
--
I'm overboard, And I need your love
Pull me up, I can't swim on my own
It's too much
Feels like I'm drowning without your love
So throw yourself out to me, my life saver