04 2020 档案
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征的“取其精华,去其糟粕”,特征在选择前后。可以改变值、也可以不改变值,只是选择后的特征维数肯定要比选择前小。 2、PCA 它是一种分析,简化数据集的技术。,是数据维数压缩,尽可能尽可能降低原
阅读全文
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归是通过正则化来防止过拟合的; 正则化可以防止过拟合是:因为过拟合的时候,拟合函数的系数往往非常大,而正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况。 正规化背后的思路就是:如果我
阅读全文
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 (1)、Variance Threshold(threshold =1.0) (2)、Varianc
阅读全文
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 什么是逻辑回归: 首先,逻辑回归是一种分类(Classification)算法。比如说:给定一封邮件,判断是不是垃圾邮件给出一个交易明细数据,判断这个交易是否是欺诈交易给出一个肿瘤检查的结果数据,判断这个肿瘤是否为恶性肿瘤逻辑回归
阅读全文
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 1)。机器学习算法中回归算法的分类 2)。回归与分类的区别 3)线性回归的定义 线性回归模型建模速度快,不需要很复杂的计算,在数据量大的情况下依然运行速度很快;可以根据系数给出每个变量的理解和解释;对异常值很敏感。 线性回
阅读全文
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 from sklearn.
阅读全文
摘要:1.扑克牌手动演练k均值聚类过程:>30张牌,3类 过程: 选择3个初始中心; 对牌进行分类,按照欧氏距离(即所分的该牌离不同中心的距离的绝对值大小)进行分类。 在第一轮分牌结束后,对每一组牌进行计算其平均值,以每组的平均值作为下一次的中心(即分牌的依据) 重复上述的步骤,直至聚类中心的值不再改变。
阅读全文
摘要:2.本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=2 1)P2 概率论与贝叶斯先验 本福特定律(Frank Benford,又称为第一数字定律),是指在实际生活得出的一组数据中,以1为首位数字出现的概率约为总数的三成;是直观想象1/9的
阅读全文
摘要:一、开发环境情况 1、Python环境: 使用了PyCharm作为开发环境: python版本为3.7: 2、pip list: 2、学习笔记 (1)机器学习概论 运用到的数学: 高数,线形回归 2.机器学习有: 1)有监督学习 2)无监督学习 3.机器学习内涵 1)可以解决:数据预测问题等问题 2
阅读全文

浙公网安备 33010602011771号