摘要:
1.手写数字数据集 # 1.手写数字数据集from sklearn.datasets import load_digitsimport numpy as npdigits = load_digits() # 读取手写数字数据集 2.图片数据预处理 x:归一化MinMaxScaler() # 对X_d 阅读全文
摘要:
1.简述人工智能、机器学习和深度学习三者的联系与区别。 答:人工只能包括了机器学习和深度学习,而机器学习又包含了深度学习。人工智能是目的,是结果;深度学习、机器学习是方法,是工具;机器学习是一种实现人工智能的方法,机器学习直接来源于早期的人工智能领域。深度学习是一种实现机器学习的技术,深度学习使得机 阅读全文
摘要:
1.逻辑回归是怎么防止过拟合的? 为什么正则化可以防止过拟合? ① 逻辑回归是怎么防止过拟合的? 答:(1) 增加样本量,这是万能的方法,适用任何模型。 (2) 如果数据稀疏,使用L1正则,其他情况,用L2要好,可自己尝试。 (3) 通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 (4) 阅读全文
摘要:
1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
摘要:
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 # 读邮件数据集文件,提取邮件本身与标签 import csvsms = open('../data/SMSSpamCollection.txt', 'r', encoding='utf-8')data = csv.reader(s 阅读全文
摘要:
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 ① 联系:分类和聚类都包含一个过程:对于想要分析的目标点,都会在数据集中寻找离它最近的点。 ② 区别: 分类是根据已知的一些样本(包括属性与类标号)来得到分类模型(即得到样本属性与类标号之间的函数),然后通过此目标函数来对只包 阅读全文
摘要:
一、用自己的话描述出其本身的含义: 1、特征选择:指从全部特征中选取一个特征子集,使得使构造出来的模型效果更好,推广能力更强。如何做特征选择呢,如果要从全部特征中选择一个最优的子集,使得其在一定的评价标准下,在当前训练和测试数据上表现最好。 2、PCA:即主成分分析方法,是一种使用最广泛的数据压缩算 阅读全文
摘要:
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 实验代码: from sklearn 阅读全文
摘要:
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 答:(1)定义:逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可 阅读全文
摘要:
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 (1)本节课的学习纲领:关于线性回归学习。 (2)监督学习:关于回归与分类的理解。 (3)线性回归定义: (4)算法矩阵、数组: 数组:0/1/2/3维数组;3维数组为RGB。 矩阵:1.必须为二维数组;2.矩阵满足了特殊 阅读全文