摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
posted @ 2020-06-09 09:47 符秋雨 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是结果;深度学习、机器学习是方法,是工具;机器学习,一种实现人工智能的方法;机器学习都可以被精准地定义为:1.任务T;2.训练过程;3.模型表现P深度学习则是一种实现机器学习的技术;它适合处理大数据。深度学习使得机器学习能够实现众多应用 阅读全文
posted @ 2020-06-01 17:42 符秋雨 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-23 18:06 符秋雨 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 源代码: 运行结果: 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # 阅读全文
posted @ 2020-05-17 13:01 符秋雨 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 (1)简述分类与聚类的联系与区别。 联系: 两者也有共同点,那就是它们都包含这样一个过程:对于想要分析的目标点,都会在数据集中寻找它最近的点,即二者都用到了NN (Nears Neighbor)算法。 区别: 分类的目的是为了确定一个点的类别,只体有哪些类 阅读全文
posted @ 2020-05-10 14:21 符秋雨 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择: 特征选择是指从已有的很多个特征中只选择几个特征,使得系统的特定指标可以最优化,是从原始特征中选择出一些最有效特征,以降低数据集维度的过程,是提高学习算法性能的一个重要手段。 2、PCA: PCA是一个线性变换。这个变换把数据变换到一个新的坐标系统中 阅读全文
posted @ 2020-04-28 09:49 符秋雨 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) (1)逻辑回归是怎么防止过拟合的? 1. 可以增加样本量,这是万能的方法,适用任何模型。2. 如果数据比较稀疏,使用L1正则,其他情况,用L2要好,可自己尝试。3. 通过特征选择,剔除一些不重要的特征,从而降低模型 阅读全文
posted @ 2020-04-27 13:10 符秋雨 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 (1)Variance Threshold(threshold =0.0) (2)Variance 阅读全文
posted @ 2020-04-27 10:21 符秋雨 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? (1)逻辑回归:是一种广义的线性回归分析模型。常用于数据挖掘,疾病自动诊断度,经济预测等领域。 (2)线性回归:利用数理统计中回百归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。常运用于数学、金融、趋势线、 阅读全文
posted @ 2020-04-24 17:35 符秋雨 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 1)回归跟分类的区别: 2)线性回归的定义以及多元一次线性的方程: 3)线性回归的机器预测跟真实值是存在一定的误差的: 4)损失函数的公式,也就是计算误差大小的公式: 5)线性回归的算法、策略、优化: 6)最小二乘法的梯度 阅读全文
posted @ 2020-04-21 12:43 符秋雨 阅读(147) 评论(0) 推荐(0) 编辑