上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 71 下一页
摘要: 一:问题规划 这一章中将讨论推荐系统的有关内容,它是在机器学习中的一个重要应用。 机器学习领域的一个伟大思想:对于某些问题,有一些算法可以自动地学习一系列合适的特征,比起手动设计或编写特征更有效率。这是目前做的比较多的研究,有一些环境能让你开发某个算法来学习使用那些特征。 接下里让我们通过推荐系统的 阅读全文
posted @ 2020-05-24 23:33 山上有风景 阅读(599) 评论(0) 推荐(0) 编辑
摘要: 一:异常检测回顾 异常检测也是一个无监督学习算法 (一)异常检测做什么? 从一组数据中找到那些“异常”的数据,基于高斯分布(正态分布)。 生活中的很多事情都是符合高斯分布的,对于数据也是如此。 我们通过参数估计,估计出数据符合的高斯分布参数,当其中的数据分布在高斯分布中概率很小的地方,就认为这是异常 阅读全文
posted @ 2020-05-24 17:58 山上有风景 阅读(777) 评论(3) 推荐(0) 编辑
摘要: 一:问题动机 将介绍异常检测问题,这是机器学习算法的常见应用,那么什么是异常检测问题? (一)举例介绍异常检测 举例:比如生产汽车引擎,需要进行质量测试,而作为测试的一部分,需要测量汽车引擎的一些特征变量: 比如:x_1引擎运转时产生的热量;x_2引擎的振动; 我们根据数据集:,把数据绘制成图,如下 阅读全文
posted @ 2020-05-24 16:54 山上有风景 阅读(5925) 评论(1) 推荐(3) 编辑
摘要: PCA简单使用 一:回顾PCA (一)主成分分析法是干什么用的? 数据降维,话句话说就是将数据地特征数量变少,但又不是简单地删除特征。 数据降维地目的可以是压缩数据,减少数据的存储空间,让算法提速; 也可以是将数据降到二维或者三维进行可视化 (二)主成分分析法在做什么? 上面说到主成分分析法用于数据 阅读全文
posted @ 2020-05-23 11:41 山上有风景 阅读(893) 评论(0) 推荐(0) 编辑
摘要: 一:降维之数据压缩 将讨论第二种无监督学习的问题:降维。数据压缩不仅能让我们对数据进行压缩,使得数据占用较少的内存和硬盘空间,还能对学习算法进行加速。 (一)降维是什么(二维降至一维) 假使我们要采用两种不同的仪器来测量一些东西的尺寸,其中一个仪器测量结果的单位是英寸,另一个仪器测量的结果是厘米,我 阅读全文
posted @ 2020-05-22 21:41 山上有风景 阅读(1756) 评论(0) 推荐(0) 编辑
摘要: K-Means算法使用 一:数据导入及可视化 import numpy as np import matplotlib.pyplot as plt import scipy.io as sio data = sio.loadmat("ex7data2.mat") X = data['X'] prin 阅读全文
posted @ 2020-05-22 12:33 山上有风景 阅读(1479) 评论(1) 推荐(1) 编辑
摘要: 一:无监督学习 这里将介绍无监督学习中的聚类算法,这将是一个激动人心的时刻,因为这是我们学习的第一个非监督学习算法。我们将要让计算机学习无标签数据,而不是此前的标签数据.那么什么是无监督学习呢? (一)有监督学习 首先,拿监督学习来进行比较,这是一个典型的监督学习的例子,有一个带标签的训练集,目标是 阅读全文
posted @ 2020-05-22 10:21 山上有风景 阅读(891) 评论(0) 推荐(0) 编辑
摘要: 邮件数据预处理 一:邮件数据读取 with open('emailSample1.txt','r') as fp: content = fp.read() #一次读取了全部数据 print(content) 二:预处理操作 (一)预处理内容 预处理主要包括以下9个部分: 1. 将大小写统一成小写字母 阅读全文
posted @ 2020-05-21 16:33 山上有风景 阅读(3179) 评论(0) 推荐(1) 编辑
摘要: 推文:支持向量机通俗导论(理解SVM的三层境界) 线性核函数 一:作业介绍 在本练习的前半部分,您将使用支持向量机。各种示例2D数据集。使用这些数据集进行实验将帮助您直观地了解支持向量机如何工作,以及如何使用支持向量机的高斯内核。 二:导入数据和数据可视化 (一)数据导入 data = sio.lo 阅读全文
posted @ 2020-05-21 11:25 山上有风景 阅读(1773) 评论(1) 推荐(0) 编辑
摘要: 到目前为止,你已经见过一系列不同的学习算法。在监督学习中,许多监督学习算法的性能都非常类似。因此,重要的不是你该选择使用学习算法A还是学习算法B,而更重要的是,应用这些算法时,所使用的数据量。这就体现了你应用这些算法时的技巧。比如:你为学习算法所设计的特征量的选择,以及如何选择正则化参数,诸如此类的 阅读全文
posted @ 2020-05-17 00:00 山上有风景 阅读(945) 评论(0) 推荐(1) 编辑
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 71 下一页