文本特征选取
摘要:
1.信息增益法 信息增益法根据某项特征ti为整个分类所能提供信息量多少来衡量该特征项的重要程度,从而决定对该项特征的取舍。 信息量的多少由信息熵来衡量,因此,信息增益即不考虑任何特征时文档的熵和考虑该特征后文章熵的差 2.卡方统计量 卡方统计量衡量的是特征t和类别C直接的相关联程度,并假设t和C直接 阅读全文
posted @ 2020-03-31 01:11 杨杨09265 阅读(126) 评论(0) 推荐(0) 编辑