2020年6月9日

主成分分析

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 答:指的是从原始特征中选择出一些最有效特征以降低数据集维度的过程 2、PCA 答:PCA是一种简化数据集的技术,通过保留低阶主成分,忽略高阶主成分做到的 二、并用自己的话阐述出两者的主要区别 答: 特征选择只是单纯的从一堆特征里筛选出想要的特征,不会 阅读全文

posted @ 2020-06-09 21:02 不忘川 阅读(102) 评论(0) 推荐(0) 编辑

机器学习十四

摘要: 第九次作业:主成分分析 https://www.cnblogs.com/huangwenshuo/p/13080732.html 由于当时在赶一个项目,和这个作业没有开直播,当我知道的时候已经过期了 1.手写数字数据集 from sklearn.datasets import load_digits 阅读全文

posted @ 2020-06-09 20:53 不忘川 阅读(194) 评论(0) 推荐(0) 编辑

2020年6月3日

机器学习 十三

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是目的,是结果;机器学习、深度学习是方法,是工具。机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。 人工智能的范围可以说很大、很泛,从表面上可以理解为机器的智能化,让机器像人一样能解决思考解决问题。简而言之,机器学习 阅读全文

posted @ 2020-06-03 19:21 不忘川 阅读(185) 评论(0) 推荐(0) 编辑

2020年5月22日

机器学习 十二

摘要: 1.读取 # 读取数据集 def read_dataset(): file_path = r'data\SMSSpamCollection' sms = open(file_path, encoding='utf-8') sms_data = [] sms_label = [] csv_reader 阅读全文

posted @ 2020-05-22 16:16 不忘川 阅读(221) 评论(0) 推荐(0) 编辑

2020年5月17日

机器学习 十一

摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv sms = open("data/SMSSpamCollection","r",encoding='utf-8') csv_reader = csv.reader(sms,delimiter="\t") for 阅读全文

posted @ 2020-05-17 17:51 不忘川 阅读(267) 评论(0) 推荐(0) 编辑

2020年5月7日

机器学习九

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 聚类分析是研究如何在没有训练的条件下把样本划分为若干类。 在分类中,已知存在哪些类,即对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来。 简述什么是监督学习与无监督学习。 监督学习:根据已有的数 阅读全文

posted @ 2020-05-07 16:52 不忘川 阅读(183) 评论(0) 推荐(0) 编辑

2020年4月27日

机器学习八

摘要: from sklearn.feature_selection.variance_threshold import VarianceThresholddef var(): VAR = VarianceThreshold(threshold=3.0) data = VAR.fit_transform([ 阅读全文

posted @ 2020-04-27 09:32 不忘川 阅读(197) 评论(0) 推荐(0) 编辑

2020年4月26日

机器学习七

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) (1)逻辑回归是利用正则化来防止过拟合的; (2)正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况; 2.用logiftic回归来进行实践操作,数据不限。 源代码 import panda 阅读全文

posted @ 2020-04-26 20:48 不忘川 阅读(181) 评论(0) 推荐(0) 编辑

2020年4月23日

机器学习六

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归: 逻辑回归用于分类,而不是回归。 在线性回归模型中,输出一般是连续的, 对于每一个输入的x,都有一个对应的输出y。因此模型的定义域和值域都可以是无穷。 但是对于逻辑回归,输入可以是连续的[-∞, +∞],但输出一般是离散 阅读全文

posted @ 2020-04-23 14:11 不忘川 阅读(133) 评论(0) 推荐(0) 编辑

2020年4月22日

机器学习五

摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 (1)、回归算法: (2)、矩阵的运算: 矩阵的乘法: (3)、最小二乘法: 2.思考线性回归算法可以用来做什么? 用来预测个人的信用度,工资 3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。 from skl 阅读全文

posted @ 2020-04-22 14:51 不忘川 阅读(119) 评论(0) 推荐(0) 编辑

导航