为生存而奔跑

   :: 首页 :: 联系 :: 聚合  :: 管理
  271 Posts :: 0 Stories :: 58 Comments :: 0 Trackbacks

留言簿(5)

我参与的团队

搜索

  •  

积分与排名

  • 积分 - 319841
  • 排名 - 75

最新评论

阅读排行榜

评论排行榜

发信人: duckyaya (逃亡), 信区: NLP
标  题: Re: 提供开源中文新闻文本分类语料库
发信站: 水木社区 (Sun Sep 12 00:35:17 2010), 站内

我以前也整理过一些

http://www.scholarpedia.org/article/Text_categorization
涉及到文本分类的基本概念,存在的问题以及方向。

http://www.cs.technion.ac.il/~gabr/resources/atc/atcbib.html
涉及到文本分类的历年文章

http://techtc.cs.technion.ac.il/
用于文本分类的ODP数据集

http://web.ist.utl.pt/~acardoso/datasets/
经过处理的单类别文本分类数据集

http://www.cs.umass.edu/~mccallum/code-data.html

http://zeddius.spaces.live.com/blog/cns!2916695FA7B7532B!538.entry
其他数据集总结的

很久没做文本分类了,呵呵。
【 在 finallyliuyu (原地转圈的驴子) 的大作中提到: 】
: 下载地址见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html

--
I'm overboard, And I need your love
Pull me up, I can't swim on my own
It's too much
Feels like I'm drowning without your love
So throw yourself out to me, my life saver
posted on 2011-02-06 21:32 baby-fly 阅读(421) 评论(0)  编辑 收藏 引用 所属分类: Information Retrival / Data Mining