04 2020 档案

摘要:一、用自己的话描述出其本身的含义: 1、特征选择 当我们拿到一个数据集的时候,它其中的特征会有很多,如果我们直接导入计算运算量将是极其庞大和没用处的,所以要对特征进行降维选择性的舍弃,留住重要部分,这个操作就叫特征选择。 2、PCA PCA是一种很成熟的用来对数据集进行简化降维的一种算法,他是在保留 阅读全文
posted @ 2020-04-30 22:00 CrJia 阅读(130) 评论(0) 推荐(0)
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合? 答: (1)可以通过增加样本量,或者提取不重要的特征进行降维来防止过拟合,也可以通过正则化来防止过拟合。 (2)正则化的原理,就是通过约束系数(w)的大小,进而抑制整体的过拟合情况。 2.用logiftic回归来进行实践操作,数据不限。 阅读全文
posted @ 2020-04-29 12:04 CrJia 阅读(292) 评论(0) 推荐(0)
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来 实验代码: 结果: 阅读全文
posted @ 2020-04-27 14:50 CrJia 阅读(105) 评论(0) 推荐(0)
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 什么是:逻辑回归本质上是一个线性回归模型,是一种用来解决二分类问题的机器学习方法,用于估计某种事物的可能性。 逻辑回归公式: 和线性回归的不同(直接上的不同):逻辑回归中因变量都是分类型变量,而线性回归的是连续性数值变量,并且逻辑 阅读全文
posted @ 2020-04-25 21:09 CrJia 阅读(410) 评论(0) 推荐(0)
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 (1)导图: (2)回归与分类的区别: (3)个各维数组及数组的类型,矩阵特性 Ⅰ、 Ⅱ、 (4)线性回归算法公式: y=w*x+b 其中b为偏置,y为要预测的结果 (5)误差问题 利用迭代算法减小误差:(理解) (6)线 阅读全文
posted @ 2020-04-22 21:50 CrJia 阅读(610) 评论(0) 推荐(0)
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 答 源代码: from s 阅读全文
posted @ 2020-04-19 21:59 CrJia 阅读(131) 评论(0) 推荐(0)
摘要:1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 实验总牌数为30,分三类进行三轮迭代。 第一轮:抽取聚类中心为:3、4、7. 聚类结果为: 第二轮:经过求平均后,重新确定聚类中心为:2、4、10 第三轮:对上类再进行求平均,选定聚类中心为2、5、10 最终聚类中心稳定在2、5、10,以此为小 阅读全文
posted @ 2020-04-16 21:45 CrJia 阅读(220) 评论(0) 推荐(0)
摘要:1)学习笔记。 2)用自己的话总结“梯度”,“梯度下降”和“贝叶斯定理"。 梯度:梯度就是一个函数在某点时方向上导数的使变化率达到最大的值,它在本质上就是一个向量,在多元函数的情况下就要求偏导。 梯度下降:我理解的是,为了找到梯度最小的位置,所以我们要在该范围内不断的求导,逐渐逼近,进而求出他的最小 阅读全文
posted @ 2020-04-16 20:22 CrJia 阅读(97) 评论(0) 推荐(0)
摘要:1)Python环境及pip list截图。 ① python环境: python开发环境: ② 安装的包: 2)视频学习笔记 机器学习:是人工智能的一个分支。我们使用计算机设计一个系统,使它能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断学习和改进;通过参数优 阅读全文
posted @ 2020-04-03 21:10 CrJia 阅读(185) 评论(0) 推荐(0)