摘要:
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
摘要:
1.简述人工智能、机器学习和深度学习三者的联系与区别。 联系: 区别:人工智能是目的,是结果。 机器学习:一种实现人工智能的方法,可以定义为:任务、训练过程、模型表现。 深度学习:是一种实现机器学习的技术,适合处理大数据。 2. 全连接神经网络与卷积神经网络的联系与区别。 区别:在全连接神经网络中, 阅读全文
摘要:
1.读取 # 读取 path = r'C:\Users\mgx13\venv\data\SMSSpamCollection' sms = open(path, 'r', encoding='utf-8') # 数据读取 sms_data = [] sms_label = [] csv_reader 阅读全文
摘要:
1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv path = r'C:\Users\mgx13\venv\data\SMSSpamCollection' sms = open(path, 'r', encoding='utf-8') csv_reader = 阅读全文
摘要:
1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答:(1)联系:分类与聚类都是对对象的一种划分,两者都用到了NN算法。 区别:分类是为了确定一个点的类别,类别是已知的,常用算法是KNN算法。 聚类是为了将一系列点分成若干类,最初是没有类别的 阅读全文
摘要:
一、用自己的话描述出其本身的含义: 1、特征选择 从数据集的所有特征里面选择和目标变量相关的特征,删除掉不需要的特征的过程 2、PCA PCA全称主成分分析法,通常用来对数据特征进行降维,但PCA所谓的降维并不是真的砍掉某些维度,而是通过线性变换,找到一个更合适描述数据的空间。实际上是挖掘出特征间的 阅读全文
摘要:
用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) from sklearn.feature_selection import VarianceThreshold de 阅读全文
摘要:
1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 防止过拟合方法: (1)增加样本量 (2)正则化方法 (3)进行特征选择,减少特征数,保留重要特征 (4)特征离散化处理 正则化防止过拟合原因: 求导: sgn(w)表示w的符号: 规定sgn(0)=0,当w为正时 阅读全文
摘要:
1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? (1)逻辑回归是机器学习中的一种分类模型,在线性回归的基础上,套用了一个逻辑函数Logistic函数(logistic function),用于估计某种事物的可能性。 (2)区别:a.线性回归是计算出具体的值,是解决回归问题;逻辑 阅读全文
摘要:
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 线性回归的应用以及它的代码实现: 线性回归的原理: 数组和矩阵的重要特性: 对于权重的求解: 梯度下降算法原理: 梯度下降的代码实现: import random import time import matplotlib 阅读全文