2020年6月10日

15 手写数字识别-小数据集

摘要: (作业补交) 2.机器学习相关数学基础 https://www.cnblogs.com/dulidemao/p/13085174.html 3.K均值算法 https://www.cnblogs.com/dulidemao/p/13070275.html 5.线性回归算法 https://www.c 阅读全文

posted @ 2020-06-10 18:26 独立的猫 阅读(162) 评论(0) 推荐(0) 编辑

2.机器学习相关数学基础

摘要: 2-机器学习相关数学基础 一、学习笔记 1.线性代数 1)基本概念 2)矩阵 3)向量 2.概率论 1)概率 2)概率分布 3)期望和方差 二、关于 “梯度”,“梯度下降”和“贝叶斯定理” 梯度:梯度是一个向量,它的方向与取得最大方向导数的方向一致,而它的模为方向导数的最大值。即函数在该点处沿着梯度 阅读全文

posted @ 2020-06-10 14:57 独立的猫 阅读(106) 评论(0) 推荐(0) 编辑

2020年6月9日

第十三次作业-垃圾邮件分类2

摘要: 1.读取 file_path = r'C:\Users\zgz\机器学习\RobitStu\SMSSpamCollection' email = open(file_path,'r',encoding='utf-8') # 打开文件 email_data = [] # 列表存邮件 email_lab 阅读全文

posted @ 2020-06-09 10:13 独立的猫 阅读(178) 评论(0) 推荐(0) 编辑

12.朴素贝叶斯-垃圾邮件分类

摘要: 作业补交 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地 阅读全文

posted @ 2020-06-09 09:37 独立的猫 阅读(148) 评论(0) 推荐(0) 编辑

9、主成分分析

摘要: 作业补交 一、用自己的话描述出其本身的含义: 1、特征选择:从原始数据中挑选出更具代表性,分类性能更好的特征,提高机器的性能 2、PCA:将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大,以此使用较少的数据维度,同时保留住较多的原数据点的特性。 二、并用自己的话阐述出两者的主要 阅读全文

posted @ 2020-06-09 09:11 独立的猫 阅读(129) 评论(0) 推荐(0) 编辑

5.线性回归算法

摘要: 作业补交 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 寻找到数据与数据之间的规律所在,从而就可以模拟出结果,也就是对结果进行预测。解决的就是通过已知的数据得到未知的结果。例如:对房价的预测、判断信用评价、电 阅读全文

posted @ 2020-06-09 09:01 独立的猫 阅读(114) 评论(0) 推荐(0) 编辑

3.K均值算法

摘要: 作业补交 1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 4). 鸢尾花完整数据做聚类并用散点图 阅读全文

posted @ 2020-06-09 08:42 独立的猫 阅读(114) 评论(0) 推荐(0) 编辑

2020年6月3日

14 深度学习-卷积

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能包含了机器学习,机器学习包含了深度学习,其中人工智能出现得最早。举例而言,如果想让机器区分一张图片中是猫还是狗,我们可以使用人工智能来解决,那么如何区分则可以使用机器学习的方法,通过对大量猫和狗的图片数据进行学习,经过算法处理生成模型, 阅读全文

posted @ 2020-06-03 21:53 独立的猫 阅读(145) 评论(0) 推荐(0) 编辑

2020年5月13日

作业11 分类与监督学习,朴素贝叶斯分类算法

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类:根据一些给定的已知类别标号的样本,训练某种学习机器(即得到某种目标函数),使它能够对未知类别的样本进行分类。 聚类:聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东 阅读全文

posted @ 2020-05-13 12:27 独立的猫 阅读(175) 评论(0) 推荐(0) 编辑

2020年4月30日

第八次作业

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu 阅读全文

posted @ 2020-04-30 11:24 独立的猫 阅读(92) 评论(0) 推荐(0) 编辑

导航