摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() # 1.手写数字数据集 from sklearn.datasets import load_digits import numpy as np digi 阅读全文
posted @ 2020-06-09 19:47 皎月星辰 阅读(249) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 搞清三者关系的最简单方法,就是把它们想象成一个同心圆,其中人工智能最大,此概念也最先问世;然后是机器学习,出现的稍晚;最后才是深度学习,不过却是如今人工智能爆炸式发展的根源,处于前两者的范围之内。 机器学习最基本的做法,是使用算法来解析数据、从 阅读全文
posted @ 2020-06-01 16:47 皎月星辰 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-23 10:59 皎月星辰 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h 阅读全文
posted @ 2020-05-17 12:20 皎月星辰 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 区别: 分类的目的是为确定一个点的类别,具体有哪些类别是已知的,常用算法是KNN,是一种有监督学习。 聚类的目的是将一系列点分为若干类,事先是没有类别的,常用算法是K-Means,是一种无监督学习。 联系: 两种的实现都包含这 阅读全文
posted @ 2020-05-10 18:34 皎月星辰 阅读(436) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征的“取其精华,去其糟粕”,特征在选择前后。可以改变值、也可以不改变值,只是选择后的特征维数肯定要比选择前小。 2、PCA 它是一种分析,简化数据集的技术。,是数据维数压缩,尽可能尽可能降低原 阅读全文
posted @ 2020-04-28 08:03 皎月星辰 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归是通过正则化来防止过拟合的; 正则化可以防止过拟合是:因为过拟合的时候,拟合函数的系数往往非常大,而正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况。 正规化背后的思路就是:如果我 阅读全文
posted @ 2020-04-27 11:53 皎月星辰 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 (1)、Variance Threshold(threshold =1.0) (2)、Varianc 阅读全文
posted @ 2020-04-27 10:03 皎月星辰 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 什么是逻辑回归: 首先,逻辑回归是一种分类(Classification)算法。比如说:给定一封邮件,判断是不是垃圾邮件给出一个交易明细数据,判断这个交易是否是欺诈交易给出一个肿瘤检查的结果数据,判断这个肿瘤是否为恶性肿瘤逻辑回归 阅读全文
posted @ 2020-04-24 21:38 皎月星辰 阅读(416) 评论(0) 推荐(0) 编辑
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 1)。机器学习算法中回归算法的分类 2)。回归与分类的区别 3)线性回归的定义 线性回归模型建模速度快,不需要很复杂的计算,在数据量大的情况下依然运行速度很快;可以根据系数给出每个变量的理解和解释;对异常值很敏感。 线性回 阅读全文
posted @ 2020-04-21 09:00 皎月星辰 阅读(334) 评论(0) 推荐(0) 编辑