机器学习——08、特征选择
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 特征选择的原因: ①冗余:部分特征的
阅读全文
机器学习——07.逻辑回归实践
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归是通过正则化防止过拟合的。数据正规化是将数据的每个样本(向量)变换为单位范数的向量,各样本之间是相互独立的。其实际上,是对向量中的每个分量值除以正规化因子。过拟合是因为数据太多太杂而造成测试误差高,而正规化
阅读全文
机器学习——06.逻辑回归
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 简单来说, 逻辑回归是一种用于解决二分类问题的机器学习方法,用于估计某种事物的可能性。逻辑回归与线性回归都是一种广义线性模型。逻辑回归假设因变量 y 服从伯努利分布,而线性回归假设因变量 y 服从高斯分布。可以说,逻辑回归是以线性
阅读全文
机器学习——05线性回归算法
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 线性回归就是对大量的观测数据进行处理,从而得到比较符合事物内部规律的数学表达式。也就是说寻找到数据与数据之间的规律所在,从而就可以模拟出结果,也就是对结果进行预测。解决的就是通过已知的数据得到未知的结果。简而言之就是通过大
阅读全文
机器学习——04K均值算法--应用
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 源代码: #加载图片 fr
阅读全文
机器学习——03K均值算法
摘要:1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 图1 统计表格 图2 第一轮实际情况 图3 第二轮实际情况 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) ps:之前人工智能老师教过这个算法,所以代码基本一样。 源代码: # 导入数据集 fro
阅读全文
机器学习——第二次作业
摘要:1.本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=2 1)P2 概率论与贝叶斯先验 2)P3 矩阵和线性代数 机器学习是一门多领域交叉学科,涉及较多的数学知识,本节课知识之前都有学过,这次根据重点重新梳理一遍,一定要多加重视。通过观看视
阅读全文
机器学习——第一次作业
摘要:1.python基础的准备 本课程拟采用Python做为机器算法应用的实现语言,所以请确保: 1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。 2)基本库的安装,如numpy、pandas、scipy、matplotlib 3)具备一定的Python编
阅读全文