摘要: 1.ROC曲线是什么? ROC 曲线是英文“receiver operating characteristic curve”的简称,对应的中文含义是“受试者工作特征曲线”。简单讲就是对不同的阈值形成混淆矩阵,从而连点成线。 2.举例说明 N 为真实的负类样本数量,P 表示真实的正类样本数量。 有10 阅读全文
posted @ 2022-10-21 14:21 许个未来— 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 1.什么是TF-IDF? TF =(某词在文档中出现的次数/文档的总词量) IDF= log e为底(语料库中文档总数/包含该词的文档数+1), +1的原因是避免分母为0 (也被称为逆文档频率,因为是总数除以包含文档数) TF-IDF = TFxIDF TF-IDF值越大表示该特征词对这个文本的重要 阅读全文
posted @ 2022-10-21 10:55 许个未来— 阅读(1280) 评论(0) 推荐(0) 编辑