集英社-富硒土壤对茶叶品质影响 调查报告

谨以此文,悼念我炸裂的计应数期中考试。下次不仅要带一个脑子做题,还得带一个脑子盯着它做题,不然第一个脑子容易跑偏刹不住车。得去黑市看一眼最近脑子市价如何,如果太贵还得卖点东西凑一凑。

简介:你说的对,但是「集英社」是「茶园」自主研发的一款全新开放问题探究项目。课题发生在一个被称作「六教-A016」的演播教室,在这里,被姚选中的人将被授予「指数级别作业」,导引「复分析」之力。你将扮演一位名为「学生」的神秘角色,在自由的「授课」中邂逅参数各异、能力独特的「公式」们,用它们一起研究开放问题,找回失散的大脑——同时,逐步发掘「挂科」的真相。

Section 1.课堂内容总结

Week 1.

Probability Space P=(U,p) 是用来描述随机事件的工具,其中 U 被称作 universepprobability function

eventU 的一个子集。

Union Bound Formula:令事件 T,T1,,且 TTi,则 Pr(T)Pr(Ti);如果 Ti 构成 T 的一组划分,则有 Pr(T)=Pr(Ti)

Conditional Probability Pr(S|T)=Pr(ST)Pr(T)。特别地,如果 Pr(T)=0 那么条件概率为零。

Chain Law of Conditional Probability Pr(S1S2)=Pr(SiS1S2Si1)

Law of total probability:如果 TTi,则 Pr(T)Pr(Ti)Pr(T|Ti)。如果 Ti 不交则取等号。

常用的处理 (1+x),其中 x 接近 0 的方法是,放缩为 ex

Week 2.

Random Variable XUR 的映射。event 可以被看作是 U{0,1} 的一种特殊概率。期望是概率与权值之积的和。

Law of Linear Expectation。概率具有线性性,就算不同事件间彼此并非独立。

Distributive Law for Expectation:若 Ti 构成 U 的划分,则 E(X)=Pr(Wi)E(X|Wi)

Markov's Inequality:对于定义在非负集合 U 上的随机变量 XPr(X>cE(X))<1c

Chebyshev's InequalityPr(|XE(X)|>cσ(X))<1c2。或者,Pr(|XE(X)|>c)<V(X)c2

Chernoff Bound:对于独立的掷硬币实验 X1,,Xn,第 i 次以 bi 的概率取 11bi0,则 Pr(X(1+δ)μ)(eδ(1+δ)1+δ)μPr(X(1δ)μ)(eδ(1δ)1δ)μ。同时有推论:Pr(X(1+δ)μ)e1/3δ2μPr(X(1δ)μ)e1/2δ2μ

Chernoff Bound 仅适用于重复抛硬币问题,但并非所有问题都能通过重复抛硬币描述。在更广泛的场合,我们有如下的:

Hoeffding's Inequality:对于 Xi(a,b),有 Pr(|XiE(Xi)|t)2exp(2t2n(ba)2)。在其不同分布时,也有 Pr(|XiE(Xi)|t)2exp(2t2(biai)2)。事实上,如果把内层的绝对值撤掉,那么右侧外部的 2 亦可撤掉。

Week 3.

要证明一个东西的级别,一个通用的想法是,用 Union Bound 证下界,用 Chebyshev's Inequality 证上界。但是 Chebyshev 需要算方差。

例如,Ramsay Number 枚举所有的 K-子集并计算其成团/独立集概率并求和,当 n 充分小时求和得到的值小于 1,因此必然存在所有子集均不合法的概率。同理,随机图最大团的下界也是用 Union Bound 证。随机图最大团贪心算法的下界同理。

上界的话,Ramsay Number 是证了递推关系 R(s,t)R(s1,t)+R(s,t1),而随机图最大团则是 Chebyshev's Inequality,但是 Variance 很难证(也没办法)。随机图最大团贪心算法也是。

Randomized BSA:i 要送到 vi。算法是随机一组 σ(i),先送到 σ 再送到 v。每步以 1o(1) 的概率在 6n 内达成。

Week 4.

  • Cauchy-Goursat 基本定理:若 f(z) 在简单闭曲线 C 及其围成区域内处处解析,那么 f(z) 沿 C 积分为零,也即 Cf(z)dz=0。【注意:要求是简单、且自身及围成的区域处处解析)

  • 直接推论:单连通域内处处解析函数沿任意简单闭曲线积分为零。

  • 进一步推广至多连通域,得到 复合闭路定理:令 C 是多联通域 D 中简单闭曲线,C1,,CkC 内部两两不交、不互相包含的曲线集合,且有 C,C1,,Ck 所夹区域被完全包含于多连通域内(也即,C1,,Ck 从多连通域内“挖掉”了若干不属于多连通域的部分),则对于在 D 中解析的 f,那么:

    • Cf(z)dz=Cif(z)dz,其中所有曲线均取(自然)正向。
    • Γf(z)dz=0,其中 Γ 指取正向的 C 和取负向的 C1,,Ck
  • 同时又有推论 闭路变形原理:解析函数沿闭曲线积分不因闭曲线的连续变形而改变值,只要闭曲线的变形不经过奇点。

  • f(z)zz0z0 可能不解析;但是可以通过不断向 z0 缩小,让 f(z) 的值逐渐接近 f(z0)Cf(z)zz0dz 接近 Cf(z0)zz0dz;后者因为 C1zz0dz 可以连续变形为套着 z0 的圆,而这个圆上 1zz0 的积分前面提到过是 2πi,因此这个值有接近 f(z0)2πi 的期望。

  • 事实上,有 Cauchy 积分公式:在区域 D 内处处解析的 f,内部完全含于 DCC 内部任一点 z0,有 f(z0)=12πiCf(z)zz0dz。通过 ϵδ 语言可证得。

  • C 为套着 z0 的圆周,得到 f(z0)=12π02πf(z0+Reiπ)dθ,也即,解析函数在圆心处的值等于其在圆周上的平均。

  • 解析函数的导数仍为解析函数,事实上解析函数 C,且 f(n)(z)=n!2πiCf(ξ)(ξz)n+1dξ高阶导数公式),其中 C 是任一环绕 z 的正向简单闭曲线,其内部全含于 D。证明就靠嗯归纳。Cauchy 积分公式是高阶导数公式 n=0 时的特例。

  • 虽然其是通过积分来表示导数,不过最常见的应用还是通过高阶导数来算环路积分。

  • Cauchy 不等式:|f(n)(z0)|n!M(R)Rn,其中 M(R) 是以 z0 为圆心的 R-圆周上 |f(z)|max

  • 解析函数的 Laurent 展开定理:设 f(z) 在圆环域 R1<|zz0|<R1 内解析,则在圆环域内 f 必可以唯一展成双边幂级数 f(z)=cn(zz0)n,其中 cn=12πiCf(ξ)(ξz0)n+1dξ,其中 C 是环绕 z0 的任一正向简单闭曲线。这个双边幂级数被称作 Laurent 级数,正幂项部分被称作 解析部分,负幂项部分被称作 主要部分

  • z0 是一个 极点 pole,如果其主要部分有有限项;其主要部分的最高(?)项次数如果是 n,则称其是一个 n 阶奇点,或者是 a pole of order n。其主要部分中负一次项系数被称作 留数 residue

  • n 阶零点,如果其解析,并且可以写成 (zz0)mφ(z),且 φ(z0)0

  • fn 阶极点是 1fn 阶零点的充要条件。

  • 留数定理:对于 m 阶极点 z0Res(f,z0)=1(m1)!limzz0dm1dzm1((zz0)mf(z))

  • 无穷远处留数的定义是 12πiCf(z)dz,其中 C 是绕原点负向,即为绕无穷远正向。此时,得到结论:如果包含无穷远极点在内仅有有限个极点,且极点都是孤立极点,那么所有留数和为零。

  • Res(f,)=Res(f(z1)z2,0)。算内极点的留数可以转为算外极点的留数。

矩阵树定理。证明可以使用 Cauchy-Binet,也可以容斥,即钦定根后随机选邻边为父亲然后容斥环。

另有 #SP=1nλ2λn,其中 λ1=0。这是因为,(λλi)=det(λILG)=(1)n1det(LG(i)(λ))。代入 λ=0,得到 (1)n1λi=(1)n1n#SP.

Week 5.

FKT 算法。

对于反对称矩阵,定义 Pf=σsgn(σ)Aσ2i1,σ2i

考虑任两个 Pfaffian 中元素 M1,M2,其中的边拼起来拼成一组排列的 cycle 形式。因此 det=Pf2

Pfaffian 中元素如果被恰当定向,使得所有的完美匹配的 sgn 都同号,则直接对行列式开根即得 Pfaffian 的绝对值,也即完美匹配数目。使得每个面上顺时针边数目都是偶数即可。

算法是随机生成树并定向,然后定向其它东西。

Pfaffian 除了被用于平面图完美匹配计数,亦可判定任意图是否存在完美匹配(用 Schwartz-Zippel 定理),乃至解决尚无确定性解法的恰出现 K 条红边的完美匹配计数(引入额外元 y

还是记一下 Schwartz-Zippel 定理吧。对于元数任意,但是次数不超过 d 的多项式,任意在有限集 S 中赋值并赋到根的概率是 d/|S|。证明关于元数归纳。

Week 6.

复杂度概念。

L:polylog(n) 空间 可解。

PSPACE:poly(n) 空间 可解。

EXP:2poly(n) 时间 可解。

BPP:以一个恒概率出错(即,原本有解被判无解)。不断重复可以让出错概率趋于零。

LPNPPSPACEEXP

NP-Hard:所有 NP 都可以规约到的问题。

NP-Complete:同时是 NP-Hard 和 NP。

如果一个 NPC 问题可以规约到另一个 NP 问题,则该问题亦是 NPC 的。

Section 2.[Wasserman] 书上内容总结

Chapter 1.

两个变量独立有着 A⨿B \amalg 的奇怪符号;不独立则有着 AB 的写法。

Bayes 公式:对于 U 的划分 TPr(Ti|B)=Pr(B|Ti)Pr(Ti)Pr(B|Tj)Pr(Tj)。其中,分母其实是 Pr(B),分子其实是 Pr(BTi)

Chapter 2.

对于随机变量 X,其大写 FX(x)=Pr(Xx),被称作 cumulative distribution function 或者 CDF。其是 R[0,1] 的函数,不论离散的 X 还是连续的 X 都有如此定义。

一切非降、正则(在负无穷处趋于 0,正无穷处趋于 1)、右连续的函数都可以是某个随机变量的 CDF

离散型随机变量是仅能取到可数个取值的随机变量。离散变量可以定义 probability functionprobability mass function fX=Pr(X=x)

连续性随机变量是存在全积分为 1 的函数 fX 且满足 Pr(a<X<b)=abfX(x)dx 的随机变量。fX 被称作 probability density function,且在所有 FX 可微处均有 fX(x)=FX(x)

inverse CDF 或者 quantile function F1(q)=inf{x:F(x)>q}。如果 F 单增且连续那么 F,F1 互为反函数。可以由此定义各种 first quantile, median, third quantile

两个 F 相同的函数被称作 equal in distribution,但并不意味着它们是同一个变量。

marginal mass function 是对二维的 probability mass function 投到一维的结果。同理有 marginal density function

两个随机变量独立,如果对于一切 A,BPr(XA,YB)=Pr(XA)Pr(YB)

对于连续随机变量,如果 f(x,y)=g(x)h(y)g,h 不一定是 PDF)那么 X,Y 独立。

条件 PMF fX|Y(x|y)=Pr(X=x|Y=y)。同理有条件 PDF fX|Y(x|y)=fX,Y(x,y)fY(y)

称若干随机变量 IIDindependend and identically distributed),如果它们独立并且服从于同一组分布 F,记作 x1,,xnF

如果对于随机变量 X,定义比如说 Y=r(X),如何计算 Y 的分布?

求出 Ay={x|r(x)y},则 FY(y)=AyfX(x)dx

Chapter 3.

期望。expectation 也被叫做 mean 或者 first moment 一阶矩。

期望的懒惰计算(The Rule of Lazy Statistician):若 Y=r(X),则 E(Y)=E(r(X))=r(x)dFX(x)=r(x)fX(x)dx

K 阶矩 Kth momentE(XK)K 阶矩存在如果该期望对应积分收敛。高阶矩存在则低阶矩必然存在。

期望线性性。如果变量独立则积的期望等于期望的积。

V(aX+b)=a2V(X)。独立的 X 有和的方差等于方差的和。

对于一组随机变量 X1,,Xn,定义样本均值 sample mean X¯n=1nXi,样本方差 sample variance Sn2=1n1(XiX¯i)2

  • 为什么是 n1?因为 X¯n 提供了一个自由度。

协方差 covariance Cov(X,Y)=E((XμX)(YμY))。相关系数 correlation ρX,Y=Cov(X,Y)σXσY

1ρ1。如果 Y=aX+b(前提是 a0),那么当 a>0ρ=1a<0ρ=1。独立变量的协方差与相关系数均为零,但是反之不亦然。

V(aiXi)=i=1nj=1naiajCov(Xi,Xj)

随机向量 [X1Xn] 的平均值向量为 μ=[μ1μn]。方差-协方差矩阵(variance-covariance matrixΣ 被定义为 V(X)=[V(X1)Cov(X1,X2)Cov(X2,X1)V(X2)]

条件期望 E(X|Y=y) 是关于 y 的函数

The Rule of Iterated ExpectationsE(E(Y|X))=E(Y),E(E(X|Y))=E(X)。事实上,E(E(r(X,Y)|X))=E(E(r(X,Y)|Y))=E(r(X,Y))

条件方差 V(X|Y=y) 亦是关于 y 的函数。V(X|Y=y)=(xμ(X|Y=y))2f(x|y)dx

V(Y)=EV(Y|X)+VE(Y|X)

矩量生成函数 Moment Generating Function, MGF,或称为 Laplace 变换 Laplace Transform,满足 ψX(t)=E(etX)=etxdF(x)=etxf(x)dx。我们希望,MGF 在 0 的邻域中有定义。这样,便可得到 ψ(0)=E(X)。事实上,ψ(k)(0)=E(Xk)

当变量彼此独立时,MGF 的积等于 的 MGF。

Y=aX+b,则 ψY(t)=ebtψX(at)

如果 ψX(t)=ψY(t)0 的邻域中相等,则 X,Y 有相同分布。

特别地,PGF 的一些优秀性质(注意区别 PGF 与 PDF)(注意区分 PGF 与 MGF):

  • p(1)=1
  • p(1)=E(X)
  • p(1)+p(1)p(1)2=V(X)

Chapter 4.

另一种 Hoeffding's Inequality 的表述:

对于独立随机变量 Y1,,Yn,且每个变量的期望均为 0,且满足 aiYbi。令一个 ϵ>0,则对于一切 t>0,都有 Pr(Yiϵ)etϵexp(t2(biai)2/8)

Mill's Inequality:对于 ZN(0,1),则 Pr(|Z|>t)2πet2/2t

Cauchy-Schwarz Inequality:对于方差有限的变量 X,YE|XY|E(X2)E(Y2)

Jensen's Inequality:对于凸的 gE(g(X))g(E(X))

posted @   Troverld  阅读(87)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示