随笔分类 - 机器学习
《机器学习实战》笔记、《机学-小象》
摘要:一、概述 【定义】如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 二、距离计算公式 两个样本的距离可以通过如下公式计算,又叫【欧式距离】 设有特征,a(a1,a2,a3),b(b1,b2,b3),那么: $$\sqrt{(a1 b1
阅读全文
摘要:一、概述 1.1【降维】 【维降】:把三维降成二维,本质就是减少特征数量; 1.2【特征选择】 什么是特征选择: 特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征。 为什
阅读全文
摘要:零、机器学习整个实现过程: 一、机器学习数据组成 1. 特征值: 2. 目标值: ========================================================================= 二、特征工程和文本特征提取 1.概要: 1、特征工程是什么 2、特征工
阅读全文
摘要:上接:https://blog.csdn.net/u010132177/article/details/102911543 概述 1)概念 特征预处理定义(作用):通过特定的 统计方法(数学方法), 将数据转换成 算法要求的数据 2)特征预处理的方法、种类 1、数值型数据 标准缩放(1 2是重点):
阅读全文
摘要:一、概述 主要学习纲要: 1、sklearn数据集与估计器 2、分类算法 k近邻算法 3、k 近邻算法实例 4、分类模型的评估 5、分类算法 朴素贝叶斯算法 6、朴素贝叶斯算法实例 7、模型的选择与调优 8、决策树与随机森林 ★★★机器学习步骤: 1. 收集数据 2. 准备输入数据 3. 分析输入数
阅读全文
摘要:一、基础概述 1、机器学习开发流程 2、机器学习模型是什么 3、机器学习算法分类 二、需明确问题 (1)算法是核心,数据和计算是基础 (2)找准定位: 大部分复杂模型的算法设计都是算法工程师在做,而我们要做的是: 1.分析很多的数据 2.分析具体的业务 3.应用常见的算法 4.特征工程、调参数、优化
阅读全文
摘要:在约会网站上使用k近邻算法 思路步骤: 1. 收集数据:提供文本文件。2. 准备数据:使用Python解析文本文件。3. 分析数据:使用Matplotlib画二维扩散图。4. 训练算法:此步骤不适用于k近邻算法。5. 测试算法:使用海伦提供的部分数据作为测试样本。 测试样本和非测试样本的区别在于:测
阅读全文
摘要:列表推导式(非numpy部分) 1.首先看看常规写法,这非常麻烦 2.列表推导式写法,上式等于 3.列表推导更高级写法,只保留大于2的写法 NumPy数组 NumPy两种【基本数据类型】:【数组】 和 【矩阵】 1.矩阵相加示例 2.矩阵乘法示例 3.矩阵平方 4.矩阵除法 5.像列表中一样访问数组
阅读全文
摘要:1.准备:使用Python导入数据 1.创建kNN.py文件,并在其中增加下面的代码: 2.在knn.py保存处,shift+右键——‘在此处打开命令窗口’,输入:python,再输入:import knn,导入刚编辑的knn.py模块: 3.为了确保输入相同的数据集,knn模块中定义了函数crea
阅读全文
摘要:课程定位以及学习目标 课程定位: 以算法、案例为驱动的学习,浅显易懂的数学知识 注意:参考书比较晦涩难懂,不建议去直接读 课程目标 熟悉机器学习各类算法的原理 掌握算法的使用,能够结合场景解决实际问题 掌握使用机器学习算法库和框架的技能 第一天 大纲: 1、机器学习概述2、数据集的结构3、数据的特征
阅读全文
摘要:无监督学习定义: 聚类应用: 6.说明: 研究人员花费了大量时间才最终实现这行代码。我不是说这个是简单的问题,但它证明了,当你使用正确的编程环境,许多学习算法是相当短的程序。所以,这也是为什么在本课中,我们打算使用 Octave 编程环境。Octave,是免费的开源软件,使用一个像 Octave 或
阅读全文
摘要:定义:监督学习指的就是我们给学习算法一个数据集,这个数据集由“正确答案”组成,然后运用学习算法,算出更多的正确答案。术语叫做回归问题 【监督学习可分为】:回归问题、分类问题。两种 例:一个学生从波特兰俄勒冈州的研究所收集了一些房价的数据。你把这些数据画出来,看起来是这个样子:横轴表示房子的面积,单位
阅读全文
摘要:1 ) Well-posed learning problem : A computer program is said to learn from experience E with respect to(关于) some task T and some performance measure(测
阅读全文