《统计学习方法》李航 读书笔记

《统计学习方法》李航 读书笔记

第1章

模型、策略、算法

模型:问题的建模,一般是条件概率的设计或者是决策函数的设计。

策略:一般是损失函数的设计。

算法:模型参数的寻优问题,例如 SGD,或者 Softmax。

机器学习基础知识

查准率、查全率、准确率定义

Preision=TPTP+FPRecall=TPTP+FNAccuracy=TP+TNTP+FP+TN+FN

第9章

例9.1(三硬币模型)

详细计算过程

已知投掷 10 次硬币,得到硬币正面 6 个,背面 4 个。

初值 π(0)=0.5p(0)=0.5q(0)=0.5

(1)yj=1,μ(1)=0.5×(0.5)10.5×(0.5)1+(10.5)(0.5)1=0.5(2)yj=0,μ(1)=0.5(3)π(1)=110j=1100.5=0.5(4)p(1)=6×0.5×1+4×0.5×05=0.6(5)q(1)=6×(10.5)10×(10.5)=0.6

迭代第一次,得到 π(1)=0.5p(1)=0.6q(1)=0.6

(6)yj=1,μ(2)=0.5×(0.6)10.5×(0.6)1+(10.5)(0.6)1=0.5(7)yj=0,μ(2)=0.5×(10.6)10.5×(0.6)0×(10.6)10+(10.5)(0.6)0(10.6)1=0.5(8)π(2)=110j=1100.5=0.5(9)p(2)=6×0.5×1+4×0.5×05=0.6(10)q(2)=6×(10.5)10×(10.5)=0.6

迭代第二次,得到 π(2)=0.5p(2)=0.6q(2)=0.6 ,收敛。

公式推导

已知随机变量A,B,C都服从0-1分布,所以有如下分布律

(11){XAb(1,π)XBb(1,p)XCb(1,q)

由此可以得到第二枚硬币(可能是B或C)的分布律

(12){Z=XAYBπb(1,p)YC(1π)b(1,q)Y=YB+YCπb(1,p)+(1π)b(1,q)

习题

1.1 伯努利模型下的极大似然估计与贝叶斯估计。

答:

伯努利模型:总体信息、样本信息

P(A|θ)=i=1NI(Oi=1)N[1]

贝叶斯估计:总体信息、样本信息、先验信息

P(A|θBayes)=k+1N+2

[1] 《概率论与数理统计(第二版)》卯师松. 高等教育出版社

1.2 当损失函数是对数损失函数时,经验风险最小化等价于极大似然估计。

经验风险最小化 min1Ni=1NL(yi|f(xi))

对数损失函数 L(Y,P(X|Y))=logP(Y|X)

证明:

损失函数为对数函数时的经验风险最小化

(13)min1Ni=1NlogP(Y|X)=max1Ni=1NlogP(Y|X)(14)max1Nlogi=1NP(Y|X)(15)max1Ni=1NP(Y|X)

9.1 用初值 π(0)=0.46p(0)=0.55q(0)=0.67 迭代例9.1

初值 π(0)=0.46p(0)=0.55q(0)=0.67

(16)yj=1uj(1)=0.46×0.550.46×0.55+(10.46)0.67=0.4115(17)yj=0uj(1)=0.46×(10.55)0.46×(10.55)+(10.46)(10.67)=0.5374(18)π(1)=6×0.4115+4×0.537410=0.4619(19)p(1)=6×0.41156×0.4115+4×0.5374=0.5346(20)q(1)=6×(10.4115)6×(10.4115)+4×(10.5374)=0.6561

第一次迭代,得到 π(1)=0.4619p(1)=0.5346q(1)=0.6561

(21)yj=1uj(2)=0.4619×0.53460.4619×0.5346+(10.4619)0.6561=0.4117(22)yj=0uj(2)=0.4619×(10.5346)0.4619×(10.5346)+(10.4619)(10.6561)=0.5347(23)π(2)=6×0.4117+4×0.537410=0.4620(24)p(2)=6×0.41176×0.4117+4×0.5374=0.5347(25)q(2)=6×(10.4117)6×(10.4117)+4×(10.5374)=0.6561

第二次迭代,得到 π(1)=0.4620p(1)=0.5347q(1)=0.6561 ,收敛。

9.2 证明 P(Y|θ)=ZP(Z|θ)P(Y|Z,θ)

(26)P(Y|θ)=P(Y,Z|θ)(27)=i=1NP(Y,zi|θ)(28)=i=1NP(Y|zi,θ)P(zi|θ)P(Y,Z)=P(Y|Z)P(Z)(29)=i=1NP(zi|θ)P(Y|zi,θ)

证毕

posted @   健康平安快乐  阅读(405)  评论(0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示