吴恩达《机器学习》课程总结(10)_机器学习系统的设计
Q1首先要做什么
本章将在随后的课程中讲误差分析,然后怎样用一个更加系统性非方法,从一堆不同的方法中,选取合适的那一个。
Q2误差分析
构建一个学习算法的推荐方法为:
(1)从一个简单的能快速实现的算法开始,实现该算法并用交叉验证集数据测试这个算法;
(2)绘制学习曲线,决定是增加更多数据,或者添加更多特征,还是其他选择;
(3)进行误差分析:人工检查交叉验证集中我们算法中产生预测误差的实例,看看这些实例是否有某种系统化的趋势。
在交叉验证集上做误差分析,不要在测试集在做误差分析。
Q类偏斜的误差度量
举例:恶性肿瘤的概率只有0.5%,这时如果不用神经网络全部预测为良性,其误差为0.5%,而用神经网络可能的出来的误差为1%,显然通过误差率来作为系统好坏的判别标准是不好的,在这种类偏斜的问题中,这时候需要用到精确度(precision,又称查准率)和召回率(recall,又称查全率)。
(1)精确度(precision):是从预测的视角看,真正为真与预测为真的比值即TP/(TP+FP)。
(2)召回率(recall):是从样本的视角看,被预测出来的正例与总正例的比值即TP/(TP+FN)。
Q4查准率和查全率之间的权衡
(1)查全率与查准率的关系:
(2)为了有一个单一的指标定义了F1值:
Q5机器学习的数据
有大量的数据(避免了方差),以及足够多的特征(避免了偏差),一般可以得到一个高性能的算法。
作者:你的雷哥
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须在文章页面给出原文连接,否则保留追究法律责任的权利。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
· 零经验选手,Compose 一天开发一款小游戏!
2018-07-31 matplotlib画图
2018-07-31 matplotlib画线(2)