问题来源
Timus Online Judge 网站上有这么一道题目:1073. Square Country。这道题目的输入是一个不大于 60,000 的正整数,要求计算出该正整数最少能够使用多少个正整数的平方和来表示。这道题目的时间限制是 1 秒。
问题解答
《数论导引(第5版)》([英]G.H.Hardy、E.M.Wright 著,人民邮电出版社,2008年10月第1版)第 320 页有以下定理:
定理 369(Lagrange 定理): 每个正整数都是四个平方数之和
在这个定理中,平方数是指整数(包括零)的平方。所以,我们有以下 C 语言程序(1073.c):
// http://acm.timus.ru/problem.aspx?space=1&num=1073 #include <stdio.h> #include <math.h> int compute(int n) { int i, j, k, m = 4; int i0 = n / 4, i2 = n, j2, k2; for (i = sqrt(n); i2 > i0; i--) if ((j2 = n - (i2 = i * i)) == 0) return 1; else for (j = sqrt(j2); j > 0; j--) if ((k2 = n - i2 - j * j) == 0) return 2; else if (k = sqrt(k2), k * k == k2 && m > 3) m = 3; return m; } int main(void) { int n; scanf("%d", &n); printf("%d", compute(n)); return 0; }
上述程序中:
- 第 7 行设置 m 的初值为 4,代表一个正整数最多只需要四个平方数就可以表示了。
- 第 9 行开始的主循环决定第一个平方数,如果 n 刚好是平方数(第 10 行),就直接返回 1。
- 第 11 行开始的内循环决定第二个平方数,如果这两个数加起来刚好等于 n (第 12 行),就直接返回 2。
- 第 13 行检查 n 是否可以表示为三个平方数的和,如果是的话,就更新 m 的值为 3 。注意,此时不能直接返回 3,因为可能在后面的循环中发现 n 可以用两个平方数表示。
- 第 14 行返回 m 值(只可能是 3 或者 4)作为最后的答案。
上述程序在 Timus Online Judge 网站的运行时间是 0.015 秒。
更好的算法
上述题目有一个进一步的版本:1593. Square Country. Version 2,输入改为不大于 1015 的正整数,时间限制还是 1 秒。上一节的程序做以下改动:
- 第 5 行的第 2 个 int 改为 long long
- 第 8 和 19 行的 int 改为 long long
- 第 20 行的 %d 改为 %lld
就可以适用于这道题目,但是运行结果是“Time limit exceeded”。此时,需要更好的算法。我们有以下 C 语言程序(1593.c):
// http://acm.timus.ru/problem.aspx?space=1&num=1593 #include <stdio.h> #include <math.h> int compute(long long n) { int i, k; long long i2; while ((n & 3) == 0) n >>= 2; if ((n & 7) == 7) return 4; for (i = 8, i2 = 9; i2 <= n; i2 += i += 8) while (n % i2 == 0) n /= i2; if (n == 1) return 1; if ((n & 1) == 0) n >>= 1; if ((n & 3) == 3) return 3; for (k = sqrt(n), i = 3; i <= k && n % i; i += 4) ; return (i > k) ? 2 : 3; } int main(void) { long long n; scanf("%lld", &n); printf("%d", compute(n)); return 0; }
在上述程序中:
- 第 9 行消去 n 的所有值为 4 因数。
- 第 10 行检测 n 是否为 8m + 7 的形式,如是,直接返回 4 (请参见下节)。
- 第 11、12 行消去 n 的所有素因子的偶次幂(素因子 2 的偶次幂已经在第 9 行消去了)。
- 第 11 行中 i2 依次为:32、52、72、...、t2,这是因为 (t + 1)2 - (t - 1)2 = 4t,每次循环 t 增加 2,所以 i 增加 4 * 2 = 8。
- 第 13 行,如果 n 等于 1,说明输入是个完全平方数,直接返回 1。
- 此时,n 的标准分解式中所有的素因子都是一次幂了。
- 第 14 行消去 n 的素因子 2 (如果有的话)。
- 第 16 行的循环中 i 从 3 开始,每次递增 4,以检查 n 是否有 4m + 3 形式的因子。
- 第 15 行和第 17 行根据定理 366 决定答案是两个还是三个平方之和。
这个程序在 Timus Online Judge 网站的运行时间是 0.828 秒。这道题目的最佳运行时间是 0.031 秒,不知道使用什么算法可以这么快。
上述算法的原理
《数论导引(第5版)》第 329 页说:
第 318 页有以下定理:
定理 366: 一个数 n 是两个平方之和,当且仅当在 n 的标准分解式中,它的所有形如 4m + 3 的素因子都有偶次幂
我们还有以下定理:
形如 4m + 3 的整数有形如 4m + 3 的素因子
列出平方数
前面的 1593.c 程序只能给出答案是几个平方数之和,而对这些平方数是什么一无所知。而 1073.c 程序倒是中规中矩地想要求解这些平方数是什么,但是从 Lagrange 定理得知最多只要四个平方数就够了,所以该程序只求解到三个平方数的情况,其余情况下答案肯定是 4 了。因此,我们将 1073.c 稍做修改,得到 1073b.c 用于列出这些平方数,如下所示:
#include <stdio.h> #include <stdlib.h> #include <math.h> static int a[5]; int compute(int n) { int i, j, k, l, m = 5; int i0 = n / 4, i2 = n, j2, k2, l2; for (i = sqrt(n); i2 > i0; i--) if ((j2 = n - (i2 = i * i)) == 0) return a[0] = i, 1; else for (j = sqrt(j2); j > 0; j--) if ((k2 = n - i2 - (j2 = j * j)) == 0) return a[0] = i, a[1] = j, 2; else for (k = sqrt(k2); k > 0; k--) if ((l2 = n - i2 - j2 - (k2 = k * k)) == 0 && m > 3) a[0] = i, a[1] = j, a[2] = k, m = 3; else if (l = sqrt(l2), l * l == l2 && m > 4) a[0] = i, a[1] = j, a[2] = k, a[3] = l, m = 4; return m; } int main(int args, char* argv[]) { int i, n, start = 1, count = 16, k; if (args > 1) start = atoi(argv[1]); if (args > 2) count = atoi(argv[2]); for (n = start; n < start + count; n++) { k = compute(n); printf("%d:%6d:", k, n); for (i = 0; i < k; i++) printf(" %d", a[i]); puts(k > 4 ? " Error!" : ""); } return 0; }
上述程序中:
- 第 5 行的全局静态数组用于记录所求的平方数,数组大小为 5, 而不是 4,是为了防止程序有 bug 时造成数组下标越界(第 32 行)。
- 第 9 行将 m 的初值从 4 改为 5,用以检测程序是否有 bug。
- 第 9、10 行增加了变量 l 和 l2 用于计算第四个平方数,并相应增加一层循环(第 15 行)。
- 第 12、14、17 和 19 行相应记录这些平方数于数组 a 中。
- 第 33 行在输出时检查程序是否有 bug。如果 k > 4 程序肯定有问题,违反了 Lagrange 定理。当然,k <= 4 并不意味着程序就没有问题了。:)
这个程序的运行结果如下所示:
E:\work> 1073b 1: 1: 1 2: 2: 1 1 3: 3: 1 1 1 1: 4: 2 2: 5: 2 1 3: 6: 2 1 1 4: 7: 2 1 1 1 2: 8: 2 2 1: 9: 3 2: 10: 3 1 3: 11: 3 1 1 3: 12: 2 2 2 2: 13: 3 2 3: 14: 3 2 1 4: 15: 3 2 1 1 1: 16: 4 E:\work> 1073b 100001 9 3:100001: 316 12 1 3:100002: 316 11 5 3:100003: 315 27 7 3:100004: 316 12 2 3:100005: 316 10 7 3:100006: 311 57 6 4:100007: 315 27 7 2 3:100008: 314 34 16 2:100009: 315 28 E:\work> 1073b 987654 3:987654: 991 58 47 4:987655: 993 39 9 2 2:987656: 734 670 3:987657: 992 53 28 3:987658: 993 40 3 3:987659: 991 67 33 3:987660: 986 110 58 3:987661: 990 75 44 3:987662: 993 38 13 4:987663: 993 38 13 1 2:987664: 992 60 3:987665: 993 40 4 3:987666: 992 59 11 3:987667: 993 33 23 3:987668: 992 60 2 2:987669: 990 87 E:\work>
如果不知道 Lagrange 定理,也就是说,假设我们不知道要多少个平方数之和才够的话,这道题目看来只好用动态规划算法来求解了。
使用递归求解
键盘农夫园友在 47 楼的评论中介绍了他的随笔“华丽的递归——将正整数表示为平方数之和”。我将该随笔中的 C 语言程序改写如下(1073c.c):
// http://acm.timus.ru/problem.aspx?space=1&num=1073 #include <stdio.h> typedef int bool; const bool true = 1; const bool false = 0; bool isSquare(int n, int v, int k) { return (n < v) ? false : (n == v) ? true : isSquare(n, v + k + 2, k + 2); } bool isSquareSum(int n, int m, int v, int k) { if (n < v) return false; if (m == 1) return isSquare(n, v, k); return isSquareSum(n - v, m - 1, v, k) ? true : isSquareSum(n, m, v + k + 2, k + 2); } int compute(int n, int m) { return isSquareSum(n, m, 1, 1) ? m : compute(n, m + 1); } int main(void) { int n; scanf("%d", &n); printf("%d", compute(n, 1)); return 0; }
这个程序本质上和键盘农夫园友的程序是没有区别的。分析如下:
- 第 9 到 12 行的 isSquare 函数判断 n 是否是不小于 v 的完全平方数。其中 k 是用于计算平方数的辅助变量。
- 第 14 到 19 行的 isSquareSum 函数判断 n 是否是 m 个不小于 v 的平方数之和。其中 k 是用于计算平方数的辅助变量。
- 第 21 到 24 行的 compute 函数计算正整数 n 最少可以表示为多少个平方数之和。
上述程序在 Timus Online Judge 网站的运行时间是 0.031 秒,而第一小节中的 1073.c 的运行时间是 0.015 秒。
如果将上述程序作如下改动:
- 第 9 行的前两个 int 改为 long long
- 第 14 行的第 1 个和第 3 个 int 改为 long long
- 第 21 行的第 2 个 int 改为 long long
- 第 28 行的 int 改为 long long
- 第 29 行的 %d 改为 %lld
就可以适用于“1593. Square Country. Version 2”,但是运行结果是“Crash (stack overflow)”。
更多的 ACM 题的解法请参见:Timus 目录。