摘要: Bagging和Boosting 阅读全文
posted @ 2021-06-25 11:11 豆咂 阅读(760) 评论(0) 推荐(0) 编辑
摘要: 偏差和方差 阅读全文
posted @ 2021-06-25 09:54 豆咂 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 支持向量机(support vector machines,SVM)是一种找到位于两类训练样本“正中间”的划分超平面的二类分类模型。这样这个划分超平面所产生的分类结果是最鲁棒的。 基本型支持向量机 划分超平面可用以下方程来表示: wTx+b=0 其中: w=(w1,w2,...,wd)为法向量,决定 阅读全文
posted @ 2021-06-24 11:15 豆咂 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 混淆矩阵(confusion matrix) 混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。 混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。每一列中的数值表示真实 阅读全文
posted @ 2021-06-23 16:57 豆咂 阅读(645) 评论(0) 推荐(0) 编辑
摘要: 上采样/下采样 阅读全文
posted @ 2021-06-23 15:36 豆咂 阅读(3631) 评论(0) 推荐(0) 编辑
摘要: 一、归一化Normalization和标准化Standardization 标准化和归一化都是将原始数据缩放到一定范围,都属于特征缩放的方法。 特征缩放的作用是: (1)使不同量纲的特征处于同一数值量级,减少方差大的特征的影响,使模型更准确。 (2)加快学习算法的收敛速度。在使用梯度下降的方法求解最 阅读全文
posted @ 2021-06-23 14:42 豆咂 阅读(1289) 评论(0) 推荐(0) 编辑
摘要: 参考:http://www.cnblogs.com/kimmychul/p/3944171.html 《数据结构》 数据结构:是指相互之间存在一种或多种特定关系的数据元素的集合数据结构就是描述对象间逻辑关系的学科 数据存储结构:它是计算机的一个概念,简单讲,就是描述数据在计算机中存储方式的学科;常用 阅读全文
posted @ 2017-03-07 18:53 豆咂 阅读(355) 评论(0) 推荐(0) 编辑
摘要: 逻辑斯谛分布 设X是连续随机变量,X服从逻辑斯谛分布是指X服从如下分布函数和密度函数: 其中,为位置参数,> 0 为形状参数。 密度函数f(x)和分布函数F(x)的图形如图所示: 分布函数属于逻辑斯谛函数,其图形是一条S形曲线,该曲线以点(μ,½)为中心对称,即满足; 曲线在中心附近增长速度较快,在 阅读全文
posted @ 2016-09-19 14:49 豆咂 阅读(5345) 评论(0) 推荐(0) 编辑
摘要: 多维缩放 参考: http://book.51cto.com/art/200812/103661.htm 《集体智慧编程》 多维缩放是一种可视化的数据表达方式,现实生活中数据远超2维,多维缩放可以为数据集找到一种二维表达形式。算法根据每对数据项之间的差距情况,尝试绘制出一幅图来,图中的各数据项之间的 阅读全文
posted @ 2016-09-18 16:28 豆咂 阅读(2057) 评论(0) 推荐(1) 编辑
摘要: k近邻 阅读全文
posted @ 2016-09-14 10:52 豆咂 阅读(2543) 评论(0) 推荐(0) 编辑