摘要:
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() (1)导入数据包 (2)读取数据 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_cate 阅读全文
摘要:
1.简述人工智能、机器学习和深度学习三者的联系与区别。 答: (1)人工智能:目的和结果,深度学习,机器学习是方法,是工具。 (2)机器学习:一种实现人工智能的方法;机器学习都可以被精准地定义为:1、任务2、训练过程3、模型表现 (3)深度学习:是一种实现机器学习的技术,适合处理大数据 2. 全连接 阅读全文
摘要:
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
摘要:
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 代码: import numpy as npimport csvp =r"SMSSpamCollection"sms= open(p,'r',encoding='utf-8')data=csv.reader(sms,delimite 阅读全文
摘要:
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 ① 联系:分类和聚类都包含一个过程:对于想要分析的目标点,都会在数据集中寻找离它最近的点。 ② 区别:分类的目的是为了确定一个点的类别 ,聚类的目的是将一系列点分成若干类,事先是没有类别的,即分类是已知的,聚类是未知的;分类是 阅读全文
摘要:
一、用自己的话描述出其本身的含义: 1、特征选择 就比如有M个特征,在其中选择N个特征使得系统的特定指标达到最优的结果,这个从M→N的过程就是特征选择。 2、PCA 一种分析、简化数据集的技术,主要是将数据的主成分(包含信息量大的维度)保留下来,忽略掉对数据 描述不重要的成分,应用于特征数量达到上百 阅读全文
摘要:
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 代码: from sklearn.feature_selection import Variance 阅读全文
摘要:
1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 答:如果你的目标是为测试数据表上0,1两种标签。我们可以用一个线性函数h(x)来分割这个空间,一边的是良性的,一边是恶性的。由于最右边一个奇元的instance影响,我们得到的直线很可能是这样的,对于许多训练集的i 阅读全文
摘要:
用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是预测结果是界于0和1之间的概率,可以适用于连续性和类别性自变量,容易使用和解释。 逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素 阅读全文
摘要:
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 自己理解:对一些数据源,特别是数据源是连续型变量,离散变量,对温度的回归预测,对天气的走向。对已有的数据来预测下一次数据的走向。在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做 阅读全文