会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
君子博学而日参省乎己 则知明而行无过矣
博客园
首页
新随笔
联系
订阅
管理
公告
2015年12月4日
#
文本特征词提取算法
摘要: 在文本分类中,需要先对文本分词,原始的文本中可能由几十万个中文词条组成,维度非常高。另外,为了提高文本分类的准确性和效率,一般先剔除决策意义不大的词语,这就是特征词提取的目的。本文将简单介绍几种文本特征词提取算法。信息增益(IG)对于一个系统,其信息熵为\(H(S)=-\sum_{i}^{C}P_i...
阅读全文
posted @ 2015-12-04 02:02 刺猬的温驯
阅读(8307)
评论(0)
推荐(0)
编辑
Powered by:
博客园
Copyright © 2024 刺猬的温驯
Powered by .NET 9.0 on Kubernetes