Convex Function
突然理解一些作者该写的不写,摸鱼的却写完的心情了……
Definition
这里的定义非常友好,国内外正好相反。所以这里不会说函数的凹凸性,统一说 \(\text{convex}\) 和 \(\text{concave}\)。
这里,我们参考外文书中的规范,\(t\in(0,1),f\big(tx+(1-t)y\big)\le tf(x)+(1-t)f(y)\) 定义了 \(\text{convex function}\)。不等号反向的是 \(\text{concave function}\)。
有几个等价的定义
首先证明这样的定义是等价的。
1
\(t\in(0,1),f\big(tx+(1-t)y\big)\le tf(x)+(1-t)f(y)\Leftrightarrow f(\frac{x+y}{2})\le \frac{f(x)+f(y)}{2}\)
左边推出右边是显然的,取 \(t=\frac12\) 即可。
右边推出左边的一个自然的想法是用二进制逼近。
发现
接下来处理分子就可以了。
首先,和上面一样,一个分子 \(S\) 如果对某个 \(n\) 成立,对于更大的也成立。
可以发现,\(n=1\) 的时候 \(0,1\) 是成立的,可以考虑证明对于任意 \(n\),\(2^{n-1}+k\) 还是成立的。
于是,取 \(1\le k<2^{n-1}\)(\(k=0\) 的情况是显然的)
然后用二进制逼近任意实数就可以了。
\(\#\) 这个做法有点蠢,等会给个更好的做法。
2
\(t\in(0,1),f\big(tx+(1-t)y\big)\le tf(x)+(1-t)f(y)\Rightarrow f^{\prime\prime}(x)\ge 0\)
考虑证明,\(\forall x<y,f^\prime(x)\le f^\prime(y)\)。
一个直观的想法是证明 \(m:=\frac12x+\frac12y,\frac{f(m)-f(x)}{m-x}\le\frac{f(y)-f(x)}{y-x}\le\frac{f(y)-f(m)}{y-m}\)。
这个其实比较容易,只需要注意到 \(m-x=\frac12(y-x)=y-m\) 然后取 \(t=\frac12\) 即可。
重复使用这个不等式,可以得到 \(a=(1-\frac{1}{2^n})x+\frac{1}{2^n}y,b=\frac1{2^n}x+(1-\frac1{2^n})y,\frac{f(a)-f(x)}{a-x}\le\frac{f(y)-f(x)}{y-x}\le\frac{f(y)-f(b)}{y-b}\),这个就是左右导数的定义,然后你都二阶导了一阶导肯定是存在的,于是就得证了。
3
\(f^{\prime\prime}(x)\ge0\Rightarrow f(\frac{x+y}{2})\le \frac{f(x)+f(y)}{2}\)
不妨设 \(x<y\),记 \(u=\frac{x+y}{2}\),在 \((x,u),(u,y)\) 上分别用一下拉格朗日中值定理。
于是就有
注意到 \(u-x=y-u\) 就结束了。
4
现在给出 \(\mathrm{1}\) 中所说更好的做法。
直观地看,函数是 \(\text{convex}\) 的等价于函数图像在弦下面,弦方程显然是 \(l(x)=f(a)+\frac{f(b)-f(a)}{b-a}(x-a)\)。
考虑 \(g(x)=f(x)-l(x)\),证明 \(g(x)_{\max}\le 0\) 即可。
因为 \(l(x)\) 是一个线性函数,容易发现 \(f(\frac{x+y}{2})\le \frac{f(x)+f(y)}{2}\Rightarrow g(\frac{x+y}{2})\le \frac{g(x)+g(y)}{2}\)。
如果最大值在端点处取到,因为 \(g(a)=g(b)=0\),那就做完了。
考虑在 \(x_0\in(a,b)\) 处取到最大值,不失一般性,\(x_0\in(a,\frac{a+b}{2})\)。
这时有
于是 \(g(x)_{\max}=g(x_0)\le 0\)。得证。
连续性
\(\text{convex function}\) 在内闭区间上是 \(\text{Lipschitz}\) 连续的。也就是 \(\forall x,y\in[a,b],|f(x)-f(y)|=O(|x-y|)\)。
这里好像需要介绍一下内闭区间,首先 \([a,b]\) 这样是闭区间,然后内的意思是 \([a,b]\) 中都是定义域 \(I\) 的内点,也就是 \(\forall x\in[a,b]\),存在一个 \(x\) 的邻域其中都是 \(I\) 中的点。
这里就是考虑定义 \(2\) 中证明的不等式:\(m:=\frac12x+\frac12y,\frac{f(m)-f(x)}{m-x}\le\frac{f(y)-f(x)}{y-x}\le\frac{f(y)-f(m)}{y-m}\),容易发现取 \(m=tx+(1-t)y\) 也是对的,之前只是我懒了。
然后取 \(A,B\in I\setminus[a,b]\quad s.t.A<a<b<B\),可以知道
于是 \(|f(x)-f(y)|\le M|x-y|\),其中 \(M=\max\{|\frac{f(a)-f(A)}{a-A}|,|\frac{f(B)-f(b)}{B-b}|\}\)。