模型评估 - 随笔分类 - 赏尔

python 用肘方法确定 kmeans 聚类中簇的最佳数量

摘要：说明： KMeans 聚类中的超参数是 K，需要我们指定。K 值一方面可以结合具体业务来确定，另一方面可以通过肘方法来估计。K 参数的最优解是以成本函数最小化为目标，成本函数为各个类畸变程度之和，每个类的畸变程度等于该类重心与其内部成员位置距离的平方和但是平均畸变程度会随着K的增大先减小后增大，所以阅读全文

posted @ 2019-12-19 17:53 赏尔阅读(8008) 评论(0) 推荐(0)

R 实现朴素贝叶斯分类器模型

摘要：# 读取数数据，查看数据结构 df_raw <- read.csv("sms_spam.csv", stringsAsFactors=F) str(df_raw) length(df_raw$type) # 将数据分为特征值矩阵 X 和类标向量y 两部分，将 y 换为因子 X <- df_raw 阅读全文

posted @ 2019-11-25 23:42 赏尔阅读(627) 评论(0) 推荐(0)

ROC 曲线

摘要：1、混淆矩阵：预测类标 1 0 合计真实类标 1 TP FN P 0 FP TN N 合计 P' N' P+N 混淆矩阵的四个术语：真正例 / 真阳性（TP），真负例 / 真阴性（TN），假正例 / 假阳性（FP）、假负例 / 假阴性（FN）。 2、分类器涉及的常见评估度量：度量公式阅读全文

posted @ 2019-11-01 22:39 赏尔阅读(493) 评论(0) 推荐(0)

ROC 曲线和 AUC 值

摘要：1、混淆矩阵：预测类标 1 0 合计真实类标 1 TP FN P 0 FP TN N 合计 P' N' P+N 混淆矩阵的四个术语：真正例 / 真阳性（TP），真负例 / 真阴性（TN），假正例 / 假阳性（FP）、假负例 / 假阴性（FN）。 2、分类器涉及的常见评估度量：度量公式阅读全文

posted @ 2019-05-02 14:33 赏尔阅读(522) 评论(0) 推荐(0)

百里希文

锦如秀

随笔分类 - 模型评估