2020年6月10日

15 手写数字识别-小数据集

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文

posted @ 2020-06-10 19:38 郑点水 阅读(117) 评论(0) 推荐(0) 编辑

2020年6月3日

14 深度学习-卷积

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 答:机器学习是现在人工智能领域中主流的一种方法,除了机器学习,科学家也尝试过其他方法在人工智能领域进行诠释和发展,而深度学习则是机器学习里面主流的方法。他们的关系不是互相独立,而是一环套着一环。 2. 全连接神经网络与卷积神经网络的联系与区别。 阅读全文

posted @ 2020-06-03 19:21 郑点水 阅读(125) 评论(0) 推荐(0) 编辑

2020年5月27日

13-垃圾邮件分类2

摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文

posted @ 2020-05-27 13:29 郑点水 阅读(127) 评论(0) 推荐(0) 编辑

2020年5月18日

12.朴素贝叶斯-垃圾邮件分类

摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 代码: 运行截图: 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # s 阅读全文

posted @ 2020-05-18 15:27 郑点水 阅读(159) 评论(0) 推荐(0) 编辑

2020年5月11日

11.分类与监督学习,朴素贝叶斯分类算法

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答:分类与聚类的联系与区别:两者联系为,都是为了将相似数据划分为区别与其他数据的一类,而且他们的都包含相同的过程,对于想要分析的目标点,都会在数据集中寻找离他最近的点,即都用到NN算法。 两者 阅读全文

posted @ 2020-05-11 19:11 郑点水 阅读(184) 评论(0) 推荐(0) 编辑

2020年4月28日

9、主成分分析

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 二、并用自己的话阐述出两者的主要区别 答:一、特征选择就是特征降维中进行人工选择的方式,主观性剔除不要的特征。而PCA则是特征降维中除了特征选择的另一种降维方法,中文名为主成分分析技术,他的作用是尽可能降低原数据的维数,简化数据。 二、两 阅读全文

posted @ 2020-04-28 15:58 郑点水 阅读(130) 评论(0) 推荐(0) 编辑

8、特征选择

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 方差为1时: 阅读全文

posted @ 2020-04-28 15:38 郑点水 阅读(92) 评论(0) 推荐(0) 编辑

7.逻辑回归实践

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 答:算法层面可以通过正则化来防止,数据层面可以通过加大样本量或者通过特征选择减少特征量,过拟合归根结底就是是太过贴近于训练数据的特征了,正则化中的L1正则便是通过增大正值向降低模型复杂度,L2正则则是通过使参数趋于 阅读全文

posted @ 2020-04-28 15:21 郑点水 阅读(145) 评论(0) 推荐(0) 编辑

2020年4月26日

6.逻辑归回

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 答:逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。本质上讲,逻辑回归处理的是分类问题,而线性回归处理的是回归问题, 2.自述一下什么是过拟合和欠 阅读全文

posted @ 2020-04-26 10:20 郑点水 阅读(143) 评论(0) 推荐(0) 编辑

2020年4月21日

5.线性回归算法

摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 回归和分类的区别: 多元线性回归和一元线性回归的区别: 线性回归算法的策略和优化 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 答:线性回归算法除了上课时提到的预测房价,预测销售额,预测贷款额度之外,它也可以 阅读全文

posted @ 2020-04-21 21:33 郑点水 阅读(136) 评论(0) 推荐(0) 编辑

导航