摘要: 任务七——深挖K近邻 一.缺失值的处理 1.也就是数据清洗的一步,最简单的方法是删除法:删除列、删除行。 2.另一种是填补法: 对于数值型变量:平均值填补、中位数填补等。 其他的方法: (1)填补上下值 (2)插值法拟合出缺失的数据进行填补 for f in features: # 插值法填充 tr 阅读全文
posted @ 2020-01-08 14:36 Ygrittee 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 任务四——KNN的决策边界+交叉验证+特征规范化 一.KNN的决策边界以及K的影响 这一部分主要是围绕着如何选择合适的K。 首先,决策边界分为:线性决策和非线性决策。随着K的增加,决策边界会变得更加平滑,模型也就越稳定。 二.交叉验证 “调参” 常用的交叉验证技术就是K折交叉验证。我们先把训练数据分 阅读全文
posted @ 2020-01-06 18:00 Ygrittee 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 任务——手写KNN算法实现分类问题 1. 导入数据集 在查资料的时候看到了导iris数据集还可以直接利用Python中的机器学习包scikit-learn直接导入。 from sklearn.datasets import load_iris data = load_iris() print(dir 阅读全文
posted @ 2019-11-23 14:56 Ygrittee 阅读(292) 评论(0) 推荐(0) 编辑
摘要: 一.AI&ML&DL 1.机器学习 机器学习是解决人工智能问题的最核心的技术。机器学习的核心是,从数据中自动学出规律。 2.深度学习 深度学习是一个框架,“深”即为把多个简单的模型叠加在一起。 3.数据的特征,样本,标签 (1)标签 标签是我们要预测的事物,即简单线性回归中的 y 变量。标签可以是小 阅读全文
posted @ 2019-11-10 21:03 Ygrittee 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 一 . 实践题目 7-2 工作分配问题 二 . 问题描述 设有n件工作分配给n个人。将工作i分配给第j个人所需的费用为cij 。 设计一个算法,对于给定的工作费用,为每一个人都分配1 件不同的工作,并使总费用达到最小。 输入格式: 输入数据的第一行有1 个正整数n (1≤n≤20)。接下来的n行,每 阅读全文
posted @ 2018-12-22 19:57 Ygrittee 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 一. 对回溯算法的理解 使用回溯算法首先要确定问题的解空间,然后从根节点出发,以深度优先的方式搜索整个解空间。 可使用递归函数来实现回溯法。 子集树和排列树是用回溯法解题时常用的两类典型的解空间树。 回溯法一定要进行剪枝,用约束函数剪去不含最优解的子树。 二. 子集和问题的解空间和约束函数 解空间: 阅读全文
posted @ 2018-12-20 10:31 Ygrittee 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 一 . 实践题目 7-3 程序存储问题 二 . 问题描述 设有n 个程序{1,2,…, n }要存放在长度为L的磁带上。程序i存放在磁带上的长度是 li,1≤i≤n。 程序存储问题要求确定这n 个程序在磁带上的一个存储方案, 使得能够在磁带上存储尽可能多的程序。 对于给定的n个程序存放在磁带上的长度 阅读全文
posted @ 2018-11-29 16:52 Ygrittee 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 一 . 对贪心算法的理解 贪心算法的基本要素是:贪心选择性质和最优子结构性质 贪心选择每次选取当前最优解,可以依赖以往的选择,但绝不依赖于将来所做的选择,也不依赖于子问题的解。 贪心算法通常以自顶向下的方式进行。 二 . 汽车加油问题的贪心选择性质 汽车应选择在能到达的前提下离自己最远的加油站进行加 阅读全文
posted @ 2018-11-29 16:23 Ygrittee 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 一 . 对动态规划算法的理解 动态规划同分治法类似,也是将问题分成子问题,先求解子问题,但是动态规划的问题中,分解后的子问题不是独立的,所以,用一个表来记录已解决的子问题,不管这个解在后续的过程中会不会用到,都将它填入表中。 步骤: 找出最优解的性质,递归的定义最优值,自底向上的计算最优值。 并且动 阅读全文
posted @ 2018-11-10 19:39 Ygrittee 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 一 . 实践题目 7-2 最大子段和 给定n个整数(可能为负数)组成的序列a[1],a[2],a[3],…,a[n],求该序列如a[i]+a[i+1]+…+a[j]的子段和的最大值。当所给的整数均为负数时,定义子段和为0。 要求算法的时间复杂度为O(n)。 输入格式: 输入有两行: 第一行是n值(1 阅读全文
posted @ 2018-11-06 20:46 Ygrittee 阅读(164) 评论(0) 推荐(0) 编辑