04 2020 档案

摘要:一、用自己的话描述出其本身的含义: 1、特征选择 由于我们一般不会直接使用原始数据,所以就要进行特征选择;特征选择就是从多个特征中选择部分特征作为训练集的特征,特征在选择前后选择后不改变值 2、PCA PCA是特征降维,降维本质上是从一个维度空间映射到另一个维度空间,也就是说讲高维度数据集映射到低维 阅读全文
posted @ 2020-04-30 11:36 荔枝干 阅读(137) 评论(0) 推荐(0) 编辑
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归在算法层面上,可以通过正则化来防止过拟合;也可以在数据层面尚通过加大样本量或者减少特征量来防止过拟合。而正则化大致上是通过让跟多的参数变为0或者参数趋于0,可以一定程度的减少过拟合的情况。 2.用logif 阅读全文
posted @ 2020-04-27 13:06 荔枝干 阅读(109) 评论(0) 推荐(0) 编辑
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 阅读全文
posted @ 2020-04-27 10:02 荔枝干 阅读(133) 评论(0) 推荐(0) 编辑
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归和线性回归最大的不同在于,逻辑回归要求因变量必须是分类变量,二分类或者多分类的,是一种分类方法;而线性回归要求因变量必须是连续的数据变量 2.自述一下什么是过拟合和欠拟合? 过拟合:过拟合就是训练样本被提取的特征比较多,这 阅读全文
posted @ 2020-04-24 22:40 荔枝干 阅读(122) 评论(0) 推荐(0) 编辑
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 回归和分类的区别最主要的一个是连续变量的预测,一个是离散变量的预测 损失函数 最小二乘法之梯度下降 梯度下降的动态图 课堂代码 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 线性回归可以应用在流行病学里做一个 阅读全文
posted @ 2020-04-22 11:55 荔枝干 阅读(153) 评论(0) 推荐(0) 编辑
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 2. 观察学习与生活中可以 阅读全文
posted @ 2020-04-19 17:01 荔枝干 阅读(167) 评论(0) 推荐(0) 编辑
摘要:(1)学习笔记 (2) 梯度:梯度跟导数差不多,都是要求导的;梯度如果是一元的就求导,多元的就求偏导。在函数的某一位置上求导,使得函数在此位置上能够让变化率达到最大 梯度下降:举个例子,在平面坐标系里有一个函数y=x2,x给定的范围是0-3,这个时候我是不知道哪里是变化率最大的位置,所以我会在x=3 阅读全文
posted @ 2020-04-14 12:05 荔枝干 阅读(102) 评论(0) 推荐(0) 编辑
摘要:(1) 扑克牌手动演练k均值聚类过程 共有30张扑克牌,数字1到10,每个数字各三张。选取1、6、10作为一开始的中心,经过三轮后得到如图结果 (2)用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 代码如下 (3)鸢尾花完整数据做聚类并用散点图显示. 代码 阅读全文
posted @ 2020-04-13 22:25 荔枝干 阅读(188) 评论(0) 推荐(0) 编辑
摘要:1.Python环境及pip list pip list 2.学习笔记 2.1什么是机器学习? 对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提供合适、优值、大量的经验E,该程序对于任务T的性能逐步提高。 这里有三个重要的机器学习的对象:(1)任务T 阅读全文
posted @ 2020-04-03 11:03 荔枝干 阅读(144) 评论(0) 推荐(0) 编辑