闲话
符号化方法更新辣!上次没说所以说一句。
以后再也不读法语文献了。让我一夜回到出生前。
推歌;如果 by 合目p feat. 诗岸
那些你不要的:多元概率生成函数应用一例
抄自 D. Foata, B. Lass, and G.-N. Han, Les nombres hyperharmoniques et la fratrie du collectionneur de vignettes. Seminaire Lotharingien de Combinatoire 47, B47a (2001), 1–20. 前半部分。后半部分因为我没学过很厉害的数学或很高妙的法语,先咕了。
考虑一个赠券收集模型:有一名赠券收藏家,他的收集册中有 m 个位置,对应 m 种彼此不同的赠券。他可以无限次地均匀随机地抽取赠券,每次抽一张,目的是达到全收集。我们已经知道了全收集时其抽取次数的期望是 mHm,其中 Hn 为第 n 个调和数。
现在,模型发生了一些变化。收藏家是家中的大哥,他有 r 个弟弟,按年龄从大到小编号为 1,…,r。每个弟弟都都有一个和大哥一样的收集册,并在获得新贴纸的时候也会放进去。弟弟们的贴纸来源如下:每次大哥抽得一张新赠券时,他会把赠券放入自己的收集册,反之他会给年龄最大的弟弟;若后者没有这张赠券,他会把赠券放入自己的收集册,反之他会给年龄第二大的弟弟,以此类推。如果一张贴纸在大哥全收集前出现了超过 r(原文如此)次,它就会被扔掉。
设 T 为表示大哥完成全收集需要抽取的次数的随机变量,并设此时编号为 k 的弟弟的收集册中还有 M(k)T 个空位。下文将通过计算随机向量 (T,M(1)T,M(2)T,…,M(r)T) 的分布的表达式,推导出每个变量的分布情况,自然得到其数学期望。具体的手法是,引入一列(差分)随机变量 {X(k)T}k≥0,使得 ∀k≥1,M(k)T=X(1)T+⋯+X(k)T,来解决原问题。一种直接的启发是,对随机向量 (T,X(1)T,X(2)T,…,X(r)T) 建立多元生成函数,随后用线性性解决问题。
为分析这个问题,首先引入超调和数 K(k)m,定义如下:
K(k)m=⎧⎪
⎪
⎪
⎪
⎪⎨⎪
⎪
⎪
⎪
⎪⎩0, m=1∧k≥11, m≥1∧k=0m∑i=2K(k−1)ii , otherwise
注意:∀n≥1,K(1)n=Hn−1,以及 ∀k≥0,K(k)2=2−k。超调和数满足 K(k)m−K(k−1)mm=K(k)m−1。我们也可以推导出(过程见不务正业 21.)对 k≥0,m≥2 有
K(k)m=m−2∑n=0(−m)¯¯¯¯¯¯¯¯¯¯n+2n!(n+2)k+1
其中 m¯¯¯n=m(m+1)⋯(m+n−1)(m¯¯¯0=1)为上升幂。
考察超调和数的列生成函数
Fm(t)=∑k≥0K(k)mtk
那么根据上方的式子,得到 (1−t/m)Fm(t)=Fm−1(t),并 F1(t)=1,得到
Fm(t)=1∏mk=2(1−t/k)
Fm 的形式有点眼熟啊!熟知次数为 d 的 n 变量完全齐次对称多项式定义为
hd(x1,…,xn)=∑1≤i1≤i2≤⋯≤id≤nxi1⋯xid
那么不妨固定 n 个变量 x1,…,xn,知道 hd 中的每一项都是从 {xk1}k≥0,{xk2}k≥0,…,{xkn}k≥0 中分别选择一个,使得它们的幂之和为 d,将它们乘起来得到的。故根据这个组合意义,得到 hd 的生成函数为
∑d≥0hd(x1,…,xn)td=n∏i=1(1+xit+(xit)2+⋯)=1∏ni=1(1−xit)
而这个形式和 Fm(t) 相同,故将 1/2,1/3,…,1/m 带入 x1,…,xm−1 得到 K(k)m=hk(1/2,1/3,…,1/m)。虽然到目前为止我们仍然没有开始解决原问题,但你先别急。
尽管最初提到的模型是一个概率论模型,其仍然具有足够优秀的组合意义。事实上,其组合上可以视作计数特定的满射类。取定 n,记 [n]:={1,2,…,n},并令 Surj(l,m) 为所有从 [l] 到 [m] 的满射组成的集合。取 f∈Surj(l,m),对 s≥1,记 νs(f) 为使 f−1(i) 的基数为 s 的 i 的数量,即可以被 s 个 [l] 中的元素映射到的 [m] 中的元素的数量。取定一个由自然数组成的向量 n=(n1,n2,…),令 Surj(l,m;n)={f∈Surj(l,m)∣∀s>0,νs(f)=ns},并令 surj(l,m,n) 为 Surj(l,m;n) 的基数。
令 t,s1,s2,… 为一系列两两交换的形式变元。定义映射 f∈Surj(m,l) 的权值为 π(f):=∏k≥1sνk(f)k,并有:∑iνi(f)=m,∑iiνi(f)=l。那么据组合意义,固定 m,自然能得到
(∑i≥1sitii!)m=∑l≥mtll!∑f∈Surj(l,m)π(f)=∑l≥mtll!∑nsurj(l,m;n)∏k≥1snii
引入 Surj(l,m;n) 的一个子集 A(l,m;n),其由满足如下性质的 f 构成:f 在集合 [l−1] 上的子映射 f|[l−1] 是由 [l−1] 到 [m]∖{f(l)} 的满射,但不能是到 [m] 的满射;即 ∀j<l,f(j)≠f(l)。令 a(l,m;n) 为 A(l,m;n) 的基数。若 f∈A(l,m;n),那么由于 l 一定对 ν1(f) 有 1 的贡献,ν1(f)≥1,π(f) 可以被 s1 整除;并取 g:=f|[l−1],那么 π(f)=π(g)s1,且根据 f(l) 相对于 g 的值域中 m−1 个元素的位置关系,可以得到
∑n∑f∈A(l,m;n)π(f)=ms1∑g∈Surj(l−1,m−1)π(g)
从而
∑l≥mtl−1(l−1)!∑n∑f∈A(l,m;n)π(f)= ∑l≥mtl−1ms1(l−1)!∑g∈Surj(l−1,m−1)π(g)= ms1∑l≥m−1tll!∑g∈Surj(l,m−1)π(g)= ms1(∑i≥1sitii!)m−1
不妨对所有 i>r 取 si=1,那么上式可以继续化为
=ms1((s1−1)t+(s2−1)t22!+⋯+(sr−1)trr!+(et−1))m−1
接着使用多项式定理得到
=ms1∑a+b+c1+⋯+cr=m−1(m−1a,b,c1,…,cr)eat(−1)br∏i=1((si−1)tii!)ci
考虑形式 Laplace 变换。令(形式)Laplace 算子为 L,其作用在形式变元 t 上的作用是将所有形如 antn/n! 的项替换为 antn,即实现了指数生成函数到普通生成函数的变换。特别地,L(tneat)=n!tn/(1−at)1+n。对上面的等式链两侧施 Laplace 变换得到(格式影响,下面不写对 a,b,c1,… 的限制)
∑l≥mtl∑na(l,m;n)r∏k=1snkk= ms1t∑a,b,c(−1)b(m−1a,b,c1,…,cr)(r∏k=1(sk−1k!)ck)t∑iici(∑iici)!(1−at)1+∑iici
到这里,我们已经获得所有需要的工具了。重新说明一下随机变量:令 T 为大哥全收集时间对应的随机变量,对 t=0,1,…,令 X(0)t 为大哥在 t 时刻收集册的空缺数对应的随机变量,那么 X(0)0=m,X(0)T=0。对 k=1,2,…,令 X(k)n 为抽取 n 次贴纸后恰好出现 k 次的贴纸数量,那么显然地,∑kX(k)T=m。此外,第 k 个弟弟的集邮册在时刻 T 的空缺数为 M(k)T=X(1)T+X(2)T+⋯+X(k)T。按照前面提到的思路,我们需要考察随机向量 (T,X(1)T,X(2)T,…,X(r)T)。
令 Y1,Y2,⋯∈[m] 为大哥每次得到的赠券的编号,根据模型得到 Yn 在 [m] 上独立地均匀随机分布。那么,大哥在 l 次抽取后完成全收集,且 ∀1≤k≤r,l 次抽取后恰好出现 k 次的贴纸数为 nk,当且仅当 :[l]→[m],i↦Yi 属于集合 A(l,m;n)。前者可以表示为事件 [T=l,X(1)T=n1,…,X(r)T=nr],后者的概率显然是 a(l,m;n)/ml。
因此,根据上面的结果,随机向量 (T,X(1)T,X(2)T,…,X(r)T) 的生成函数按下式给出:
∑l≥m∑nP[T=l,X(1)T=n1,…,X(r)T=nr]sn11⋯snrrtl= ∑l≥m(tm)l∑na(l,m;n)r∏k=1snkk= s1t∑a,b,c(−1)b(m−1a,b,c1,…,cr)(r∏k=1(sk−1k!)ck)(t/m)∑iici(∑iici)!(1−at/m)1+∑iici
用这个可以轻松算出 E[T]=mHm。当然,重要的是,我们一旦获得了 X(k)T 的概率生成函数,就能通过求导并带入 sk=1 得到期望值了。具体地,有
GX(1)T(s):=∑n≥1P[X(1)T=n]sn=s∑a+b+c=m−1(−1)b(m−1a,b,c)(s−1)c(t/m)cc!(1−at/m)c+1=∑a+b+c=m−1(−1)b(m−1a,b,c)ms(s−1)cc!(m−a)c+1
对 k≥2,有
GX(k)T(s):=∑n≥1P[X(k)T=n]sn=∑a+b+c=m−1(−1)b(m−1a,b,c)(s−1)c(k!)c(1/m)kc(kc)!(1−a/m)kc+1=∑a+b+c=m−1(−1)b(m−1a,b,c)(s−1)cm(kc)!(k!)c(m−a)kc+1
故
E[X(1)T]=G′X(1)T(1)= m−1∑a=0(−1)m−1−a(m−1a)mm−a+m−2∑a=0(−1)m−2−a(m−2a)m(m−1)(m−a)2= −m−1∑b=0(−m)¯¯¯¯¯¯¯¯¯b+1(b+1)!+m−2∑b=0(−m)¯¯¯¯¯¯¯¯¯b+2b!(b+2)2= 1+K(1)m=Hm
此外,对于 k≥2,同样地有
E[X(k)T]=G′X(k)T(1)=m−2∑b=0(−m)¯¯¯¯¯¯¯¯¯b+2b!(b+2)k+1=K(k)m
综上,我们得到了 E[T]=mHm,E[M(1)T]=Hm,∀k≥2,E[M(k)T]=1+K(1)m+⋯+K(k)m。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
2023-01-25 闲话 23.1.25