随笔分类 -  机器学习

摘要:文章目录 填空题第一章 机器学习基础第二章 数据预处理KNN算法支持向量机集成学习决策树聚类算法联结学习三种池化操作 选择题计算题数据正规化Hopfield网络能量函数计算卷积、池化操作 应用题决策树、朴素贝叶斯、聚类算法单层感知器构造(连接神经元部分)深度学习网络 填空题 第一章 机器学习基础 按 阅读全文
posted @ 2022-12-12 11:46 chanxe 阅读(990) 评论(0) 推荐(1) 编辑
摘要:1、使用KNN算法对两个未知类型的样本进行分类(冰川水或者湖泊水),其中K=3,即选择最近的3个邻居。(20分) 样本 Ca+浓度 Mg+浓度 Na+浓度 Cl-浓度 类型 A 0.2 0.5 0.1 0.1 湖泊水 B 0.4 0.3 0.4 0.3 冰川水 C 0.3 0.4 0.6 0.3 湖 阅读全文
posted @ 2022-11-28 10:54 chanxe 阅读(483) 评论(0) 推荐(0) 编辑
摘要:人工神经网络 文章目录 人工神经网络例题 例题 试根据训练集: D = ( ( 1 , 2 ) T , 1 ) , ( ( 3 , 3 ) T , 1 ) , ( ( 2 , 1 ) T , − 1 ) , ( ( 5 , 2 ) T , − 1 ) D={((1,2)^T,1),((3,3)^T, 阅读全文
posted @ 2022-11-28 10:48 chanxe 阅读(145) 评论(0) 推荐(0) 编辑
摘要:支持向量机与集成学习 文章目录 支持向量机与集成学习支持向量机的基本原理线性可分支持向量 常用核函数集成学习概述集成学习的两种方式集成学习的基本类型弱学习其合成方式 AdaBoost算法训练过程简例 一类按监督学习方式对数据进行二元分类的广义线性分类器 支持向量机的基本原理 线性可分 一维空间存在一 阅读全文
posted @ 2022-11-21 11:22 chanxe 阅读(107) 评论(0) 推荐(0) 编辑
摘要:文章目录 聚类分析K-means算法K-中心算法DBSCAN算法 聚类分析 K-means算法 算法简要步骤 随机选取K个样本点(不一定来自样本数据)作为初始的质心第一次迭代,将所有样本分配到这K个类中 对每个样本计算其到两个聚类中心的欧式距离(一般)将其分配到距离最近中心所在簇中重新计算聚类中心, 阅读全文
posted @ 2022-10-31 17:03 chanxe 阅读(88) 评论(0) 推荐(0) 编辑
摘要:划分标准 信息增益 信息熵 假设当前样本集合D中第k类样本所占比例为 p k ( k = 1 , 2 , 3 , . . . . , ∣ r ∣ ) p_k(k = 1, 2, 3, ....,|r|) pk​(k=1,2,3,....,∣r∣) E n t ( D ) = ∑ k = 1 ∣ r 阅读全文
posted @ 2022-10-28 15:30 chanxe 阅读(17) 评论(0) 推荐(0) 编辑
摘要:简单的分类算法 朴素贝叶斯分类算法 求解先验概率:C为一个类别集合, c i c_i ci​是第i个类别,求解概率 P ( c i ) P(c_i) P(ci​) 求解类别条件概率:x为一个待分类项, a k a_k ak​是x的第k个特征属性,假设这些属性相互独立 P ( x ∣ c i ) = 阅读全文
posted @ 2022-10-27 12:04 chanxe 阅读(29) 评论(0) 推荐(0) 编辑
摘要:数据预处理 数据清洗 缺失值处理 缺失值是一种典型的数据不完备情况 处理方法 丢弃整个样本 存在缺失值的样本在样本集的比例不大时有效可能导致过拟合 用特殊值表示缺失 使用属性统计进行填充 数值型使用平均值,非数值型使用众数 已知属性的值去预测 分配所有可能的值 离群值检测 离群值是指那些与大多数样本 阅读全文
posted @ 2022-10-27 09:21 chanxe 阅读(32) 评论(0) 推荐(0) 编辑
摘要:重要概念 训练集 包含待测试数据的所有特征,以及该数据的标签,用于训练模型 验证集 用于调整模型 测试集 包含待测试数据的所有特征,以及该数据的标签,用于检测模型是否符合要求 交叉验证法 将数据划分为 k 个子集。然后,我们在 k-1 个子集上迭代训练算法,同时使用剩余的子集作为测试集。 欠拟合 在 阅读全文
posted @ 2022-10-24 21:06 chanxe 阅读(16) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示