04 2020 档案

摘要:一、用自己的话描述出其本身的含义: 1、特征选择 从提取到的所有特征中选择和类标签有关的特征作为训练集特征,特征在选择前和选择后不改变值。 2、PCA 将多个变量通过线性变换以选出较少个重要变量的一种多元统计分析方法。本质上是从一个维度空间映射到另一个维度空间,在映射的过程中特征值也会相应的变化。 阅读全文
posted @ 2020-04-30 08:53 linyanli 阅读(165) 评论(0) 推荐(0)
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 防止过拟合: (1)进行特征选择,消除关联性大的特征 (2)加大样本量 (3)交叉验证(让所有数据都有过训练) (4)正则化 正则化可以防止过拟合的原因: L1正则,通过增大正则项导致更多参数为0,参数系数化降低模 阅读全文
posted @ 2020-04-27 16:56 linyanli 阅读(175) 评论(0) 推荐(0)
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 阅读全文
posted @ 2020-04-27 16:35 linyanli 阅读(128) 评论(0) 推荐(0)
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归虽然名字中有“回归”,但实际却是一种分类学习方法,它将数据拟合到一个logit函数或者是 logistic函数中,从而能够完成对事件发生的概率进行预测。 虽然逻辑回归能够用于分类,不过其本质还是线性回归。它仅在线性回归的基 阅读全文
posted @ 2020-04-23 10:02 linyanli 阅读(322) 评论(0) 推荐(0)
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 回归问题的判定: 回归和分类的区别: 应用:房价预测、销售额预测、贷款额度的预测等。 单因素影响的一元线性模型例子:房价预测。 横坐标为房子面积,纵坐标为价格。 线性回归的定义:通过一个或多个自变量与因变量之间进行建模的回 阅读全文
posted @ 2020-04-20 15:10 linyanli 阅读(242) 评论(0) 推荐(0)
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 完整的代码: 1 from 阅读全文
posted @ 2020-04-16 09:01 linyanli 阅读(264) 评论(0) 推荐(0)
摘要:1. 机器学习的步骤 : 数据,模型选择,训练,测试,预测 2. 安装机器学习库sklearn pip list 查看版本 python -m pip install --upgrade pip pip install -U scikit-learn pip uninstall sklearn pi 阅读全文
posted @ 2020-04-15 21:18 linyanli 阅读(262) 评论(0) 推荐(0)
摘要:本周任务: 请确保熟悉并理解机器学习数学部分常用相关概念: 1.高等数学 1)函数 2)极限 3)导数 4)极值和最值 5)泰勒级数 6)梯度 7)梯度下降 2.线性代数 1)基本概念 2)行列式 3)矩阵 4)最小二乘法 5)向量的线性相关性 3.概率论 1)事件 2)排列组合 3)概率 4)贝叶 阅读全文
posted @ 2020-04-11 23:15 linyanli 阅读(195) 评论(0) 推荐(0)
摘要:1.python基础的准备 本课程拟采用Python做为机器算法应用的实现语言,所以请确保: 1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。 2)基本库的安装,如numpy、pandas、scipy、matplotlib 3)具备一定的Python编 阅读全文
posted @ 2020-04-02 12:18 linyanli 阅读(237) 评论(0) 推荐(0)