整数划分问题是算法中的一个经典命题之一,有关这个问题的讲述在讲解到递归时基本都将涉及。所谓整数划分,是指把一个正整数n写成如下形式:
n=m1+m2+...+mi; (其中mi为正整数,并且1 <= mi <= n),则{m1,m2,...,mi}为n的一个划分。
如果{m1,m2,...,mi}中的最大值不超过m,即max(m1,m2,...,mi)<=m,则称它属于n的一个m划分。这里我们记n的m划分的个数为f(n,m);
例如但n=4时,他有5个划分,{4},{3,1},{2,2},{2,1,1},{1,1,1,1};
注意4=1+3 和 4=3+1被认为是同一个划分。
该问题是求出n的所有划分个数,即f(n, n)。下面我们考虑求f(n,m)的方法;
---------------------------------------------------------------------
(一)递归法
---------------------------------------------------------------------
根据n和m的关系,考虑以下几种情况:
(1)当 n = 1 时,不论m的值为多少(m > 0 ),只有一种划分即 { 1 };
(2) 当 m = 1 时,不论n的值为多少,只有一种划分即 n 个 1,{ 1, 1, 1, ..., 1 };
(3) 当 n = m 时,根据划分中是否包含 n,可以分为两种情况:
(a). 划分中包含n的情况,只有一个即 { n };
(b). 划分中不包含n的情况,这时划分中最大的数字也一定比 n 小,即 n 的所有 ( n - 1 ) 划分。
因此 f(n, n) = 1 + f(n, n-1);
(4) 当 n < m 时,由于划分中不可能出现负数,因此就相当于 f(n, n);
(5) 但 n > m 时,根据划分中是否包含最大值 m,可以分为两种情况:
(a). 划分中包含 m 的情况,即 { m, { x1, x2, ..., xi } }, 其中 { x1, x2, ..., xi } 的和为 n - m,可能再次出现 m,因此是(n - m)的 m 划分,因此这种划分
个数为 f(n-m, m);
(b). 划分中不包含 m 的情况,则划分中所有值都比 m 小,即 n 的 ( m - 1 ) 划分,个数为 f(n, m - 1);
因此 f(n, m) = f(n - m, m) + f(n, m - 1);
综合以上情况,我们可以看出,上面的结论具有递归定义特征,其中(1)和(2)属于回归条件,(3)和(4)属于特殊情况,将会转换为情况(5)。而情况(5)为通用情况,属于递推的方法,其本质主要是通过减小m以达到回归条件,从而解决问题。其递推表达式如下:
f(n, m) = 1; ( n = 1 or m = 1 )
f(n, n); ( n < m )
1+ f(n, m - 1); ( n = m )
f(n - m, m) + f(n, m - 1); ( n > m )
因此我们可以给出求出 f(n, m) 的递归函数代码如下(引用 Copyright Ching-Kuang Shene July / 23 / 1989 的代码):
我们可以发现,这个命题的特征和另一个递归命题:
“上台阶”问题(斐波那契数列)(http://www.cnblogs.com/hoodlum1980/archive/2007/07/13/817188.html)
相似,也就是说,由于树的“天然递归性”,使这类问题的解可以通过树来展现,每一个叶子节点的路径是一个解。因此把上面的函数改造一下,让所有划分装配到一个.NET类库中的TreeView控件,相关代码(c#)如下:
如果我们要输出所有解,只需要输出所有叶子节点的路径即可,可以同样用递归函数来输出所有叶子节点(代码中使用了一个StringBuilder对象来接收所有叶子节点的路径):
这个小例子的运行效果如下(源代码都在文中,就不提供下载链接):
通过递归思路,我们给出了n的划分个数的算法,也把所有划分组装到一棵树中。好,关于递归思路我们就暂时介绍到这里。关于输出所有划分的标准代码在这里省略了,我们有时间再做详细分析。
---------------------------------------------------------------------
(二)母函数法
---------------------------------------------------------------------
下面我们从另一个角度即“母函数”的角度来考虑这个问题。
所谓母函数,即为关于x的一个多项式G(x):
有 G(x)= a0 + a1*x + a2*x^2 + a3*x^3 + ...
则我们称G(x)为序列(a0,a1,a2,...)的母函数。关于母函数的思路我们不做更多分析。
我们从整数划分考虑,假设n的某个划分中,1的出现个数记为a1,2的个数记为a2,..., i的个数记为ai,
显然: ak<=n/k; (0<= k <=n)
因此n的划分数f(n,n),也就是从1到n这n个数字中抽取这样的组合,每个数字理论上可以无限重复出现,即个数随意,使他们的总和为n。显然,数字i可以有如下可能,出现0次(即不出现),1次,2次,..., k次,等等。把数字i用(x^i)表示,出现k次的数字i用 x^(i*k)表示, 不出现用1表示。例如数字2用x^2表示,2个2用x^4表示,3个2用x^6表示,k个2用x^2k表示。
则对于从1到N的所有可能组合结果我们可以表示为:
G(x) = (1+x+x^2+x^3+...+x^n) (1+x^2+x^4+...) (1+x^3+x^6+...) ... (1+x^n)
= g(x,1) g(x,2) g(x,3) ... g(x, n)
= a0 + a1* x + a2* x^2 + ... + an* x^n + ... ; (展开式)
上面的表达式中,每一个括号内的多项式代表了数字i的参与到划分中的所有可能情况。因此该多项式展开后,由于x^a * x^b=x^(a+b),因此 x^i 就代表了i的划分,展开后(x^i)项的系数也就是i的所有划分的个数,即f(n,n)=an (上式中g(x,i)表示数字i的所有可能出现情况)。
由此我们找到了关于整数划分的母函数G(x);剩下的问题是,我们需要求出G(x)的展开后的所有系数。
为此我们首先要做多项式乘法,对于我们来说并不困难。我们把一个关于x的一元多项式用一个整数数组a[]表示,a[i]代表x^i的系数,即:
g(x) = a[0] + a[1]x + a[2]x^2 + ... + a[n]x^n;
则关于多项式乘法的代码如下,其中数组a和数组b表示两个要相乘的多项式,结果存储到数组c:
下面我们求出G(x)的展开结果,G(x)是n个多项式连乘的结果:
通过以上的代码,我们就计算出了G(x)的展开后的结果,保存到数组c中。此时有:f(n,n)=c[n];剩下的工作只是把相应的数组元素输出即可。
问题到了这里已经解决完毕。但我们发现,针对该问题,g(x,k)是一个比较特殊的多项式,特点是只有k的整数倍的索引位置有项,而其他位置都为0,具有项“稀疏”的特点,并且项次分布均匀(次数跨度为k)。这样我们就可以考虑在计算多项式乘法时,可以减少一些循环。因此可以对Poly函数做这样的一个改进,即把k作为参数传递给Poly:
这样,原有的函数可以认为是k=1的情况(即多项式b不具有上诉规律)。相应的,在上面的Init函数中的调用改为Poly2(k)即可。
---------------------------------------------------------------------------------
参考资料:
(1)关于“递归”部分的代码,参考了Ching-Kuang Shene,July/23/1989的代码;
(2)关于“母函数”部分,参考了《Acm程序设计》(刘春英)(PPT文档);
(3)“母函数”方法的Init和Poly的代码,参考了某位教师的代码 : ymc 2008/09/25, 其中多项式乘法的改进是我提出的建议。
-- by hoodlum1980 2008-10-11