摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv filepath = r"SMSSpamCollection"#路径位置 sms = open(filepath, 'r', encoding='utf-8')#读取 csv_reader = csv.read 阅读全文
posted @ 2020-05-18 16:12 跛豪丶 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 联系:分类和聚类都是把每一条记录归应到对应的类别,对于想用分析的目标点,都会在数据集寻找离它最近的点,二个都用到了NN算法,结果是一样的。 区别:对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的,比如对一个学 阅读全文
posted @ 2020-05-08 19:48 跛豪丶 阅读(320) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是在一堆数据中筛选出符合要求的特征,没有对该其降维或变化。 2、PCA 主成分分析PCA,就是降低维数,就是减少数据的某些属性,降低冗余,同时也从这些现有的特征中重建新的特征,提高了准确性。 二、并用自己的话阐述出两者的主要区别 特征选择 阅读全文
posted @ 2020-04-28 09:56 跛豪丶 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 2.用logiftic回归来进行实践操作,数据不限。 1、逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合? (1)逻辑回归是怎么防止过拟合的? 1. 增加样本量,适用任何模型。 2. 如果数据稀疏,使用L1 阅读全文
posted @ 2020-04-27 11:45 跛豪丶 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 from sklearn.feature_selection import VarianceThre 阅读全文
posted @ 2020-04-27 09:57 跛豪丶 阅读(111) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。 线性回归要求因变量必须是连续性数据变量;逻辑回归要求因变量必须是分类变量,二分类或者多分类的。 2.自述一下什么是过拟合和欠拟合? 一般来说拟合 阅读全文
posted @ 2020-04-23 16:57 跛豪丶 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题) 1.线性回归的知识总结 (1)机器学习的回归,回归是属于监督学习 (2)回归算法 (3)回 阅读全文
posted @ 2020-04-20 16:12 跛豪丶 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 2. 观察学习与生活中可以 阅读全文
posted @ 2020-04-18 19:38 跛豪丶 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 4). 鸢尾花完整数据做聚类并用散点图显示. 5 阅读全文
posted @ 2020-04-13 17:40 跛豪丶 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 2.本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=2 1)P2 概率论与贝叶斯先验 2)P3 矩阵和线性代数 机器学习是一门多领域交叉学科,涉及较多的数学知识,本节课知识之前都有学过,这次根据重点重新梳理一遍,一定要多加重视。通过观看视 阅读全文
posted @ 2020-04-13 12:04 跛豪丶 阅读(141) 评论(0) 推荐(0) 编辑