Convex Function

突然理解一些作者该写的不写,摸鱼的却写完的心情了……

Definition

这里的定义非常友好,国内外正好相反。所以这里不会说函数的凹凸性,统一说 \(\text{convex}\)\(\text{concave}\)

这里,我们参考外文书中的规范,\(t\in(0,1),f\big(tx+(1-t)y\big)\le tf(x)+(1-t)f(y)\) 定义了 \(\text{convex function}\)。不等号反向的是 \(\text{concave function}\)

有几个等价的定义

\[\begin{align*} f(\frac{x+y}{2})&\le \frac{f(x)+f(y)}{2}\\ f^{\prime\prime}(x)&\ge 0 \end{align*} \]

首先证明这样的定义是等价的。

1

\(t\in(0,1),f\big(tx+(1-t)y\big)\le tf(x)+(1-t)f(y)\Leftrightarrow f(\frac{x+y}{2})\le \frac{f(x)+f(y)}{2}\)

左边推出右边是显然的,取 \(t=\frac12\) 即可。

右边推出左边的一个自然的想法是用二进制逼近。

发现

\[\begin{align*} f\big(\frac1{2^n}x+(1-\frac1{2^n})y\big)&=f\big(\frac{\big(\frac1{2^{n-1}}x+(1-\frac1{2^{n-1}})y\big)+y}{2}\big)\\ &\le \frac12(f\big(\frac1{2^{n-1}}x+(1-\frac1{2^{n-1}})y)+f(y)\big)\\ &..(\text{归纳})\\ &\le \frac1{2^n}f(x)+(1-\frac1{2^n})f(y) \end{align*} \]

接下来处理分子就可以了。

首先,和上面一样,一个分子 \(S\) 如果对某个 \(n\) 成立,对于更大的也成立。

可以发现,\(n=1\) 的时候 \(0,1\) 是成立的,可以考虑证明对于任意 \(n\)\(2^{n-1}+k\) 还是成立的。

于是,取 \(1\le k<2^{n-1}\)\(k=0\) 的情况是显然的)

\[\begin{align*} f(\frac{k+2^{n-1}}{2^n}x+\frac{2^{n-1}-k}{2^n}y)&=f(\frac{x+\big(\frac{k}{2^{n-1}}x+\frac{2^{n-1}-k}{2^{n-1}}y\big)}{2})\\ &\le\frac12\big(f(x)+f(\frac{k}{2^{n-1}}x+\frac{2^{n-1}-k}{2^{n-1}}y)\big)\\ &..(\text{归纳})\\ &\le\frac{k+2^{n-1}}{2^n}f(x)+\frac{2^{n-1}-k}{2^n}f(y) \end{align*} \]

然后用二进制逼近任意实数就可以了。

\(\#\) 这个做法有点蠢,等会给个更好的做法。

2

\(t\in(0,1),f\big(tx+(1-t)y\big)\le tf(x)+(1-t)f(y)\Rightarrow f^{\prime\prime}(x)\ge 0\)

考虑证明,\(\forall x<y,f^\prime(x)\le f^\prime(y)\)

一个直观的想法是证明 \(m:=\frac12x+\frac12y,\frac{f(m)-f(x)}{m-x}\le\frac{f(y)-f(x)}{y-x}\le\frac{f(y)-f(m)}{y-m}\)

这个其实比较容易,只需要注意到 \(m-x=\frac12(y-x)=y-m\) 然后取 \(t=\frac12\) 即可。

重复使用这个不等式,可以得到 \(a=(1-\frac{1}{2^n})x+\frac{1}{2^n}y,b=\frac1{2^n}x+(1-\frac1{2^n})y,\frac{f(a)-f(x)}{a-x}\le\frac{f(y)-f(x)}{y-x}\le\frac{f(y)-f(b)}{y-b}\),这个就是左右导数的定义,然后你都二阶导了一阶导肯定是存在的,于是就得证了。

3

\(f^{\prime\prime}(x)\ge0\Rightarrow f(\frac{x+y}{2})\le \frac{f(x)+f(y)}{2}\)

不妨设 \(x<y\),记 \(u=\frac{x+y}{2}\),在 \((x,u),(u,y)\) 上分别用一下拉格朗日中值定理。

\[\begin{align*} \exists \eta_1\in(x,u),f^\prime(\eta_1)(u-x)&=f(u)-f(x)\\ \exists \eta_2\in(u,y),f^\prime(\eta_2)(y-u)&=f(y)-f(u) \end{align*} \]

于是就有

\[f(\eta_1)=\frac{f(u)-f(x)}{u-x}\le f(\eta_2)=\frac{f(y)-f(u)}{y-u} \]

注意到 \(u-x=y-u\) 就结束了。

4

现在给出 \(\mathrm{1}\) 中所说更好的做法。

直观地看,函数是 \(\text{convex}\) 的等价于函数图像在弦下面,弦方程显然是 \(l(x)=f(a)+\frac{f(b)-f(a)}{b-a}(x-a)\)

考虑 \(g(x)=f(x)-l(x)\),证明 \(g(x)_{\max}\le 0\) 即可。

因为 \(l(x)\) 是一个线性函数,容易发现 \(f(\frac{x+y}{2})\le \frac{f(x)+f(y)}{2}\Rightarrow g(\frac{x+y}{2})\le \frac{g(x)+g(y)}{2}\)

如果最大值在端点处取到,因为 \(g(a)=g(b)=0\),那就做完了。

考虑在 \(x_0\in(a,b)\) 处取到最大值,不失一般性,\(x_0\in(a,\frac{a+b}{2})\)

这时有

\[\begin{align*} g(x_0)&=g(\frac{(2x_0-a)+a}{2})\\ &\le\frac12\big(\underbrace{g(2x_0-a)}_{\le g(x)_{\max}=g(x_0)}+\underbrace{g(a)}_{=0}\big)\\ &\le\frac12g(x_0) \end{align*} \]

于是 \(g(x)_{\max}=g(x_0)\le 0\)。得证。

连续性

\(\text{convex function}\) 在内闭区间上是 \(\text{Lipschitz}\) 连续的。也就是 \(\forall x,y\in[a,b],|f(x)-f(y)|=O(|x-y|)\)

这里好像需要介绍一下内闭区间,首先 \([a,b]\) 这样是闭区间,然后内的意思是 \([a,b]\) 中都是定义域 \(I\) 的内点,也就是 \(\forall x\in[a,b]\),存在一个 \(x\) 的邻域其中都是 \(I\) 中的点。

这里就是考虑定义 \(2\) 中证明的不等式:\(m:=\frac12x+\frac12y,\frac{f(m)-f(x)}{m-x}\le\frac{f(y)-f(x)}{y-x}\le\frac{f(y)-f(m)}{y-m}\),容易发现取 \(m=tx+(1-t)y\) 也是对的,之前只是我懒了。

然后取 \(A,B\in I\setminus[a,b]\quad s.t.A<a<b<B\),可以知道

\[\forall x,y\in[a,b],\frac{f(a)-f(A)}{a-A}\le\frac{f(x)-f(y)}{x-y}\le\frac{f(B)-f(b)}{B-b} \]

于是 \(|f(x)-f(y)|\le M|x-y|\),其中 \(M=\max\{|\frac{f(a)-f(A)}{a-A}|,|\frac{f(B)-f(b)}{B-b}|\}\)

posted @ 2024-11-14 16:30  嘉年华_efX  阅读(9)  评论(0编辑  收藏  举报