摘要:
本章主要讲解机器学习中的一个重要应用——推荐系统。 Problem formulation 本节课以预测电影评分为例,介绍了什么是推荐系统。 我们有5部电影和4个用户,要求用户从0-5对电影打分: 注:?表示用户没有打分的电影,也就是需要我们预测的电影。 前3部电影是爱情片,后2部电影是动作片,可以 阅读全文
摘要:
本章主要介绍异常检测(Anomaly detection)问题,这是机器学习算法的一个常见应用。这种算法的有趣之处在于,它虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题。 Problem motivation 主要介绍了什么是异常检测,以及其应用。 Anomaly detec 阅读全文
摘要:
本章主要讲解第二类无监督学习问题——降维。 Motivation I: Data Compression 本节课主要讲解降维的第一个作用——数据压缩。 数据压缩不仅能够降低对内存或磁盘空间的占用,更重要的是能加快我们的学习算法。 假设我们有两个特征,$x_1$用厘米表示,$x_2$用英寸表示,显然这 阅读全文
摘要:
Unsupervised learning introduction 通过和监督学习进行对比,简单介绍了无监督学习。 在一个监督学习问题中,我们的训练集是有标签(y)的,我们需要据此训练假设函数,来拟合出一个决策边界。 而在无监督学习问题中,我们的训练集是没有任何标签的,我们需要算法自己从这些数据中 阅读全文
摘要:
本章主要讲解支持向量机算法,也是最后一个详细讲解的监督学习算法。 Optimization objective 从逻辑回归算法引入到支持向量机(SVM,support vector machine)算法,讲解了支持向量机的数学定义。 Alternative view of logistic regr 阅读全文
摘要:
本章主要讲解机器学习系统的设计,给出一些构建复杂机器学习系统的建议,可以在构建大型机器学习系统时节约时间。 Prioritizing what to work on: Spam classification example 本章以构建一个垃圾邮件分类器为例讲解机器学习系统设计。 下面有两封邮件,左边 阅读全文
摘要:
Deciding what to try next 本章节主要讲解了在应用机器学习时的一些建议,重点关注的问题是假如你在开发一个机器学习系统,或者尝试改进一个机器学习系统的性能,你应该如何决定接下来选择哪条道路。 Debugging a learning algorithm 为了解释这个问题,我们继 阅读全文
摘要:
本章主要讲解如何求解神经网络的权重(参数)。 Cost Function 主要讲解了神经网络的代价函数(分类问题中的)。 Neural Network(Classification) 引入一些标记方法方便后续讨论: 假设神经网络有$m$个训练样本,每个训练样本包含一组输入特征$x$和一组输出信号$y 阅读全文
摘要:
当我们的特征值太多,模型太复杂时,之前学习的线性回归和逻辑回归都会遇到计算负荷太大的问题,所以我们需要学习神经网络。 Non-linear Hypotheses 本节课程主要通过示例讲解了引入神经网络的实际意义。 之前的一个例子: 在这个例子中,由于我们只有$x_1$和$x_2$两个特征值,所以即使 阅读全文
摘要:
之前讲解了机器学习中的回归问题,本章节主要讲解了另外一类问题——分类问题。 Classification 本节课引入了机器学习的另外一类问题——分类问题。 分类问题的应用: Email: Spam / Not Spam? Online Transactions: Fraudulent (Yes / 阅读全文