摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
posted @ 2020-06-09 10:59 千初 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 联系: 区别:人工智能是目的,是结果。 机器学习:一种实现人工智能的方法,可以定义为:任务、训练过程、模型表现。 深度学习:是一种实现机器学习的技术,适合处理大数据。 2. 全连接神经网络与卷积神经网络的联系与区别。 区别:在全连接神经网络中, 阅读全文
posted @ 2020-06-01 10:23 千初 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 1.读取 # 读取 path = r'C:\Users\mgx13\venv\data\SMSSpamCollection' sms = open(path, 'r', encoding='utf-8') # 数据读取 sms_data = [] sms_label = [] csv_reader 阅读全文
posted @ 2020-05-25 23:19 千初 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv path = r'C:\Users\mgx13\venv\data\SMSSpamCollection' sms = open(path, 'r', encoding='utf-8') csv_reader = 阅读全文
posted @ 2020-05-18 14:17 千初 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答:(1)联系:分类与聚类都是对对象的一种划分,两者都用到了NN算法。 区别:分类是为了确定一个点的类别,类别是已知的,常用算法是KNN算法。 聚类是为了将一系列点分成若干类,最初是没有类别的 阅读全文
posted @ 2020-05-08 17:23 千初 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 从数据集的所有特征里面选择和目标变量相关的特征,删除掉不需要的特征的过程 2、PCA PCA全称主成分分析法,通常用来对数据特征进行降维,但PCA所谓的降维并不是真的砍掉某些维度,而是通过线性变换,找到一个更合适描述数据的空间。实际上是挖掘出特征间的 阅读全文
posted @ 2020-04-28 00:15 千初 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) from sklearn.feature_selection import VarianceThreshold de 阅读全文
posted @ 2020-04-27 14:46 千初 阅读(76) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 防止过拟合方法: (1)增加样本量 (2)正则化方法 (3)进行特征选择,减少特征数,保留重要特征 (4)特征离散化处理 正则化防止过拟合原因: 求导: sgn(w)表示w的符号: 规定sgn(0)=0,当w为正时 阅读全文
posted @ 2020-04-27 13:30 千初 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? (1)逻辑回归是机器学习中的一种分类模型,在线性回归的基础上,套用了一个逻辑函数Logistic函数(logistic function),用于估计某种事物的可能性。 (2)区别:a.线性回归是计算出具体的值,是解决回归问题;逻辑 阅读全文
posted @ 2020-04-23 22:00 千初 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 线性回归的应用以及它的代码实现: 线性回归的原理: 数组和矩阵的重要特性: 对于权重的求解: 梯度下降算法原理: 梯度下降的代码实现: import random import time import matplotlib 阅读全文
posted @ 2020-04-21 12:15 千初 阅读(242) 评论(0) 推荐(0) 编辑