《统计学习方法》李航 读书笔记
第1章
模型、策略、算法
模型:问题的建模,一般是条件概率的设计或者是决策函数的设计。
策略:一般是损失函数的设计。
算法:模型参数的寻优问题,例如 SGD,或者 Softmax。
机器学习基础知识
查准率、查全率、准确率定义
Preision=TPTP+FPRecall=TPTP+FNAccuracy=TP+TNTP+FP+TN+FN
第9章
例9.1(三硬币模型)
详细计算过程
已知投掷 10 次硬币,得到硬币正面 6 个,背面 4 个。
初值 π(0)=0.5p(0)=0.5q(0)=0.5
yj=1时,μ(1)=0.5×(0.5)10.5×(0.5)1+(1−0.5)(0.5)1=0.5yj=0时,μ(1)=0.5π(1)=11010∑j=10.5=0.5p(1)=6×0.5×1+4×0.5×05=0.6q(1)=6×(1−0.5)10×(1−0.5)=0.6(1)(2)(3)(4)(5)
迭代第一次,得到 π(1)=0.5p(1)=0.6q(1)=0.6
yj=1时,μ(2)=0.5×(0.6)10.5×(0.6)1+(1−0.5)(0.6)1=0.5yj=0时,μ(2)=0.5×(1−0.6)10.5×(0.6)0×(1−0.6)1−0+(1−0.5)(0.6)0(1−0.6)1=0.5π(2)=11010∑j=10.5=0.5p(2)=6×0.5×1+4×0.5×05=0.6q(2)=6×(1−0.5)10×(1−0.5)=0.6(6)(7)(8)(9)(10)
迭代第二次,得到 π(2)=0.5p(2)=0.6q(2)=0.6 ,收敛。
公式推导
已知随机变量A,B,C都服从0-1分布,所以有如下分布律
⎧⎪⎨⎪⎩XA∼b(1,π)XB∼b(1,p)XC∼b(1,q)(11)
由此可以得到第二枚硬币(可能是B或C)的分布律
⎧⎪⎨⎪⎩Z=XAYB∼πb(1,p)YC∼(1−π)b(1,q)⟹Y=YB+YC∼πb(1,p)+(1−π)b(1,q)(12)
习题
1.1 伯努利模型下的极大似然估计与贝叶斯估计。
答:
伯努利模型:总体信息、样本信息
P(A|θ)=N∑i=1I(Oi=1)N[1]
贝叶斯估计:总体信息、样本信息、先验信息
P(A|θBayes)=k+1N+2
[1] 《概率论与数理统计(第二版)》卯师松. 高等教育出版社
1.2 当损失函数是对数损失函数时,经验风险最小化等价于极大似然估计。
经验风险最小化 min1N∑Ni=1L(yi|f(xi))
对数损失函数 L(Y,P(X|Y))=−logP(Y|X)
证明:
损失函数为对数函数时的经验风险最小化
min1NN∑i=1−logP(Y|X)=max1NN∑i=1logP(Y|X)⟹max1NlogN∑i=1P(Y|X)⟹max1NN∑i=1P(Y|X)极大似然估计(13)(14)(15)
9.1 用初值 π(0)=0.46p(0)=0.55q(0)=0.67 迭代例9.1
初值 π(0)=0.46p(0)=0.55q(0)=0.67
yj=1时,u(1)j=0.46×0.550.46×0.55+(1−0.46)0.67=0.4115yj=0时,u(1)j=0.46×(1−0.55)0.46×(1−0.55)+(1−0.46)(1−0.67)=0.5374π(1)=6×0.4115+4×0.537410=0.4619p(1)=6×0.41156×0.4115+4×0.5374=0.5346q(1)=6×(1−0.4115)6×(1−0.4115)+4×(1−0.5374)=0.6561(16)(17)(18)(19)(20)
第一次迭代,得到 π(1)=0.4619p(1)=0.5346q(1)=0.6561
yj=1时,u(2)j=0.4619×0.53460.4619×0.5346+(1−0.4619)0.6561=0.4117yj=0时,u(2)j=0.4619×(1−0.5346)0.4619×(1−0.5346)+(1−0.4619)(1−0.6561)=0.5347π(2)=6×0.4117+4×0.537410=0.4620p(2)=6×0.41176×0.4117+4×0.5374=0.5347q(2)=6×(1−0.4117)6×(1−0.4117)+4×(1−0.5374)=0.6561(21)(22)(23)(24)(25)
第二次迭代,得到 π(1)=0.4620p(1)=0.5347q(1)=0.6561 ,收敛。
9.2 证明 P(Y|θ)=∑ZP(Z|θ)P(Y|Z,θ) 。
P(Y|θ)=P(Y,Z|θ)=N∑i=1P(Y,zi|θ)=N∑i=1P(Y|zi,θ)P(zi|θ),根据P(Y,Z)=P(Y|Z)P(Z)=N∑i=1P(zi|θ)P(Y|zi,θ)(26)(27)(28)(29)
证毕
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)