02 2023 档案
摘要:# 十七、应用实例:图片文字识别(Application Example: Photo OCR) ## 17.1 问题描述和OCR 照片OCR实际是照片光学字符识别.图像文字识别应用所作的事是,从一张给定的图片中识别文字.这比从一份扫描文档中识别文字要复杂的多. ![image](https://i
阅读全文
摘要:# 十六、大规模机器学习(Large Scale Machine Learning) ## 16.1 大型数据集的学习 如果我们有一个低偏差的模型,增加数据集的规模可以帮助你获得更好的结果.但是,大部分大数据集学习都有一个计算问题. 以线性回归模型为例,假如我们有一亿样本,每一次梯度下降迭代,我们都
阅读全文
摘要:# 十五、推荐系统(Recommender Systems) ## 15.1 问题形式化 我们从一个例子开始定义推荐系统的问题: 假使我们是一个电影供应商,我们有 5 部电影和 4 个用户,我们要求用户为电影打分. ![image](https://img2023.cnblogs.com/blog/
阅读全文
摘要:# 十四、异常检测(Anomaly Detection) ## 14.1 问题的动机 在接下来的小节里,我将大家介绍异常检测(Anomaly detection)问题.这是机器学习算法的一个常见应用.这种算法的一个有趣之处在于:它虽然主要用于非监督学习问题,但从某些角度看,它又类似于一些监督学习问题
阅读全文
摘要:# 十三、降维(Dimensionality Reduction) ## 13.1 目标一:数据压缩 本节讨论第二类无监督学习问题,降维.有几个不同的的原因使你可能想要做降维,一是数据压缩.数据压缩不仅允许我们压缩数据,从而使用较少的计算机内存或磁盘空间,它也让我们加快我们的学习算法. 那么,什么是
阅读全文
摘要:# 十二、聚类(Clustering) ## 12.1 无监督学习 从本节开始,我们开始学习无监督学习,我们将要让计算机学习无标签数据,而不是此前的标签数据. 那么,什么是非监督学习呢?在一个典型的监督学习中,我们有一个有标签的训练集,我们的目标是找到能够区分正样本和负样本的决策边界,在这里的监督学
阅读全文
摘要:# 十一、支持向量机(Support Vector Machines) ## 11.1 优化目标 到目前为止,你已经见过一系列不同的学习算法.在监督学习中,许多学习算法的性能都非常类似.因此,重要的不是你该选择使用学习算法A还是学习算法B,而更重要的是,应用这些算法时,所创建的大量数据在应用这些算法
阅读全文
摘要:# 十、机器学习系统的设计(Machine Learning System Design) ## 11.1 确定执行的优先级 在接下来的视频中,我将谈到机器学习系统的设计.这些视频将谈及在设计复杂的机器学习系统时,你将遇到的主要问题.同时我们会试着给出一些关于如何巧妙构建一个复杂的机器学习系统的建议
阅读全文