董学沉啦

2020年6月8日

摘要： 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() （1）导入数据包（2）读取数据 2.图片数据预处理 x：归一化MinMaxScaler() y：独热编码OneHotEncoder()或to_cate 阅读全文

posted @ 2020-06-08 23:38 董学沉啦阅读(548) 评论(0) 推荐(0)

2020年6月1日

14 卷积运算

摘要： 1.简述人工智能、机器学习和深度学习三者的联系与区别。答：（1）人工智能：目的和结果，深度学习，机器学习是方法，是工具。（2)机器学习：一种实现人工智能的方法；机器学习都可以被精准地定义为：1、任务2、训练过程3、模型表现（3）深度学习：是一种实现机器学习的技术，适合处理大数据 2. 全连接阅读全文

posted @ 2020-06-01 11:40 董学沉啦阅读(284) 评论(0) 推荐(0)

2020年5月22日

13-垃圾邮件分类

摘要： 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文

posted @ 2020-05-22 23:51 董学沉啦阅读(1016) 评论(0) 推荐(0)

2020年5月16日

作业十二朴素贝叶斯垃圾邮件

摘要： 1. 读邮件数据集文件，提取邮件本身与标签。列表 numpy数组代码： import numpy as npimport csvp =r"SMSSpamCollection"sms= open(p,'r',encoding='utf-8')data=csv.reader(sms,delimite 阅读全文

posted @ 2020-05-16 03:49 董学沉啦阅读(304) 评论(0) 推荐(0)

2020年5月8日

作业十朴素贝叶斯

摘要： 1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。 ① 联系：分类和聚类都包含一个过程：对于想要分析的目标点，都会在数据集中寻找离它最近的点。 ② 区别：分类的目的是为了确定一个点的类别，聚类的目的是将一系列点分成若干类，事先是没有类别的，即分类是已知的，聚类是未知的；分类是阅读全文

posted @ 2020-05-08 23:25 董学沉啦阅读(221) 评论(0) 推荐(0)

2020年4月27日

作业九主成分分析

摘要：一、用自己的话描述出其本身的含义： 1、特征选择就比如有M个特征，在其中选择N个特征使得系统的特定指标达到最优的结果，这个从M→N的过程就是特征选择。 2、PCA 一种分析、简化数据集的技术，主要是将数据的主成分（包含信息量大的维度）保留下来，忽略掉对数据描述不重要的成分，应用于特征数量达到上百阅读全文

posted @ 2020-04-27 21:05 董学沉啦阅读(138) 评论(0) 推荐(0)

作业八特征选择

摘要：用过滤法对以下数据进行特征选择： [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求： 1、Variance Threshold（threshold =1.0） 2、将结果截图代码： from sklearn.feature_selection import Variance 阅读全文

posted @ 2020-04-27 09:36 董学沉啦阅读(177) 评论(0) 推荐(0)

2020年4月26日

作业七逻辑回归应用

摘要： 1.逻辑回归是怎么防止过拟合的？为什么正则化可以防止过拟合？（大家用自己的话介绍下）答：如果你的目标是为测试数据表上0,1两种标签。我们可以用一个线性函数h(x)来分割这个空间，一边的是良性的，一边是恶性的。由于最右边一个奇元的instance影响，我们得到的直线很可能是这样的，对于许多训练集的i 阅读全文

posted @ 2020-04-26 19:33 董学沉啦阅读(204) 评论(0) 推荐(0)

2020年4月23日

作业六逻辑回归

摘要：用自己的话描述一下，什么是逻辑回归，与线性回归对比，有什么不同？逻辑回归是预测结果是界于0和1之间的概率，可以适用于连续性和类别性自变量，容易使用和解释。逻辑回归又称logistic回归分析，是一种广义的线性回归分析模型，常用于数据挖掘，疾病自动诊断，经济预测等领域。例如，探讨引发疾病的危险因素阅读全文

posted @ 2020-04-23 12:52 董学沉啦阅读(246) 评论(0) 推荐(0)

2020年4月20日

作业五线性回归算法

摘要： 1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性自己理解：对一些数据源，特别是数据源是连续型变量，离散变量，对温度的回归预测，对天气的走向。对已有的数据来预测下一次数据的走向。在线性回归中，数据使用线性预测函数来建模，并且未知的模型参数也是通过数据来估计。这些模型被叫做阅读全文

posted @ 2020-04-20 20:58 董学沉啦阅读(297) 评论(0) 推荐(0)

公告