随笔分类 -  机器学习

摘要:参考:ROC与AUC 1. 总结:绘制ROC曲线时,横坐标是FPR(False Positive Rate),纵坐标是TPR(True Positive Rate),ROC曲线上的每一个点由一个分类器(例如逻辑回归分类器)取某一个概率阈值(例如取0.8作为阈值,则预测的概率大于0.8视为正样本,否则 阅读全文
posted @ 2021-12-07 11:56 morein2008 编辑
摘要:Say you have one feature and a target with 3 possible values X = np.array([3.4, 3.4, 3. , 2.8, 2.7, 2.9, 3.3, 3. , 3.8, 2.5]) y = np.array([0, 0, 0, 1 阅读全文
posted @ 2021-12-06 21:10 morein2008 编辑
摘要:参考:什么是卡方检验 连续投掷硬币50次,其中22次为正面,28次为方面,问这枚硬币是否是正常硬币? 这是个假设检验的问题。 若用卡方检验来做,需要先用上面的公式计算卡方值X2,然后查表看卡方值有没有落入指定区间,即可判定是否应该接受假设。 类似的抛骰子的例子:抛36次,已知各个点数朝上的次数,问是 阅读全文
posted @ 2021-11-19 16:00 morein2008 编辑
摘要:用LDA模型抽取文本特征,再用线性SVM分类,发现效果很差,F1=0.654。 Precision:0.680,Recall:0.649,F1:0.654 RandomForestClassifier的表现也比较差: Precision:0.680,Recall:0.668,F1:0.670 而随便 阅读全文
posted @ 2020-12-04 20:20 morein2008 编辑
摘要:1、accuracy即我们通常理解的准确率,计算的时候是指在预测值pred与目标值target之间重叠的部分的大小除以pred的大小(或target的大小,因为sklearn要求pred与target大小必须一致)。 比如 target=[2,2,2,3,2] pred=[2,2,1,3,4] 此时 阅读全文
posted @ 2020-10-23 17:36 morein2008 编辑

点击右上角即可分享
微信分享提示