2024.10.15 闲话

感受一下 2024 年集训队论文!虽然可能 joke3579 在 2022 年就读过了(?

歌:all is ai - 歌愛ユキ & GUMI .


首先回忆一下拉格朗日乘数法 . 对于带等式约束的最优化问题:

max f(x)s.t. {g1(x)=0gm(x)=0

其中 f,g1mRnR 的连续可微函数,则可以加入拉格朗日乘数 λ1m 把问题改写为

maxxminλ{f(x)+i=1mλigi(x)}

那么在 gi(x)0 的时候可以调整 λi 让 min 取到 ,所以所有 gi(x) 肯定都为 0 .

具体的拉格朗日乘数定理和拉格朗日乘数法可以看论文,这里先跳过一下 . 总之这部分只需要感受这股 λ 的劲!

介绍:拉格朗日对偶!

对于 f:RnR,g:RnRm,h:RnRp,考虑最优化问题:

max f(x)s.t. g(x)0h(x)=0

定义拉格朗日函数 F:Rn×Rm×RpR 为:

F(x,λ,ν)=f(x)+λTg(x)+νTh(x)

定义拉格朗日对偶函数 L:Rm×RpR

L(λ,ν)=maxxF(x,λ,ν)

定义其拉格朗日对偶问题为:

min L(λ,ν)s.t. λ0

此处首先 L 有凸性,其次在某些情况下原问题和拉格朗日对偶问题的解相等 .

凸性

考虑到应该也没多少人想看所以就折叠一下 . 其实也比较简单,就直接暴力代入定义就可以了 .

考虑:

L(aλ1+(1a)λ2,aν1+(1a)ν2)=maxxF(x,aλ1+(1a)λ2,aν1+(1a)ν2)

最大值在 x0 处取到,则:

L(aλ1+(1a)λ2,aν1+(1a)ν2)=F(x0,aλ1+(1a)λ2,aν1+(1a)ν2)=f(x0)+(aλ1+(1a)λ2)Tg(x0)+(aν1+(1a)ν2)Th(x0)=a(f(x0)+λ1Tg(x0)+ν1Th(x0))+(1a)(f(x0)+λ2Tg(x0)+ν2Th(x0))=aF(x0,λ1,ν1)+(1a)F(x0,λ2,ν2)aL(λ1,ν1)+(1a)L(λ2,ν2)

对于对偶性,先不加证明地给出几个定理:

min-max 不等式

对于 F:Dx×DyR,有 maxyminxF(x,y)minxmaxyF(x,y) .

minimax 定理

对于 DxRn,DyRm 是紧致凸集,连续函数 F:Dx×DyR 关于 x 是凸函数、关于 y 是凹函数,有 maxyminxF(x,y)=minxmaxyF(x,y) .

此处需要解释一下定义:

  • Rn 的子集是紧致的当且仅当它是闭集合且有界 .
  • Rn 的子集 S 是凸集当且仅当它 p,qS,λ[0,1],λp+(1λ)qS .
  • 对于凸集 Cf:CR 是凸函数当且仅当 p,qC,λ[0,1],f(λp+(1λ)q)λf(p)+(1λ)f(q) .
  • 对于凸集 Cf:CR 是凹函数当且仅当 p,qC,λ[0,1],f(λp+(1λ)q)λf(p)+(1λ)f(q) .

然后有弱对偶性:原问题的最优解一定不大于拉格朗日对偶问题的最优解 .

具体证明也是加入拉格朗日乘数:

s=maxg(x)0,h(x)=0f(x)=maxxminλ0,ν{f(x)+λTg(x)+νT}minλ0,νmaxx{f(x)+λTg(x)+νT}=minλ0,nL(λ,ν)=t

然后如果这里的不等号满足 minimax 定理条件则等号成立 . 听说 OI 中用这个等号成立条件就够了?

然而对线性规划使用拉格朗日对偶只会得到常规的对偶 .

其实用这种东西好像能更理性解释一下纳什均衡的规划怎么做的,原来那个 2023.11.7 闲话的解释有点玄学的感觉了 .

先跳过博弈论,双人每人策略集合有限的完全信息静态非合作零和博弈的纳什均衡相当于这样的问题:有一个 n×m 矩阵 A,一种策略可以由列向量 a,b 表示,其中 a,b 的每个元素都在 [0,1] 间且分别的和为 1 . 此时两人的期望收益分别等于 aTAbaTAb . 策略是纳什均衡的当且仅当每个人只改变自己的策略都不会让自己的期望收益增加 .

可以证明这样的博弈一定存在纳什均衡点且这样的纳什均衡点期望收益相同 . 若纳什均衡时双方的策略为 a0,b0,则:

maxaaTAb0=minba0TAb

可以扩写为:

minbmaxaaTAbmaxaaTAb0=minba0TAbmaxaminbaTAb

根据 min-max 不等式可知此时不等号中等号全部成立,那么可以把纳什均衡改成一个两步的博弈,每步每人选择自己的向量,这样就方便分析了 . 原文写的是用 minimax 定理但是感觉道理不多 .

习题:THUPC2023 初赛 欺诈游戏 .

upd. 那个无意识之外的捉迷藏好像也是这种

Reference. 施开成《浅谈拉格朗日乘数及对偶在 OI 中的应用》 .

但是不管你喜不喜欢,它永远都在那里 .

怎么放四张空白图钓鱼啊。。

历史上的今天!

posted @   yspm  阅读(210)  评论(13编辑  收藏  举报
相关博文:
阅读排行:
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】
历史上的今天:
2023-10-15 关于 EI 的三次多项式复合的一些注解
😅​
点击右上角即可分享
微信分享提示