问题来源
Timus Online Judge 网站上有这么一道题目:1073. Square Country。这道题目的输入是一个不大于 60,000 的正整数,要求计算出该正整数最少能够使用多少个正整数的平方和来表示。这道题目的时间限制是 1 秒。
问题解答
《数论导引(第5版)》([英]G.H.Hardy、E.M.Wright 著,人民邮电出版社,2008年10月第1版)第 320 页有以下定理:
定理 369(Lagrange 定理): 每个正整数都是四个平方数之和
在这个定理中,平方数是指整数(包括零)的平方。所以,我们有以下 C 语言程序(1073.c):
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 | // http://acm.timus.ru/problem.aspx?space=1&num=1073 #include <stdio.h> #include <math.h> int compute( int n) { int i, j, k, m = 4; int i0 = n / 4, i2 = n, j2, k2; for (i = sqrt (n); i2 > i0; i--) if ((j2 = n - (i2 = i * i)) == 0) return 1; else for (j = sqrt (j2); j > 0; j--) if ((k2 = n - i2 - j * j) == 0) return 2; else if (k = sqrt (k2), k * k == k2 && m > 3) m = 3; return m; } int main( void ) { int n; scanf ( "%d" , &n); printf ( "%d" , compute(n)); return 0; } |
上述程序中:
- 第 7 行设置 m 的初值为 4,代表一个正整数最多只需要四个平方数就可以表示了。
- 第 9 行开始的主循环决定第一个平方数,如果 n 刚好是平方数(第 10 行),就直接返回 1。
- 第 11 行开始的内循环决定第二个平方数,如果这两个数加起来刚好等于 n (第 12 行),就直接返回 2。
- 第 13 行检查 n 是否可以表示为三个平方数的和,如果是的话,就更新 m 的值为 3 。注意,此时不能直接返回 3,因为可能在后面的循环中发现 n 可以用两个平方数表示。
- 第 14 行返回 m 值(只可能是 3 或者 4)作为最后的答案。
上述程序在 Timus Online Judge 网站的运行时间是 0.015 秒。
更好的算法
上述题目有一个进一步的版本:1593. Square Country. Version 2,输入改为不大于 1015 的正整数,时间限制还是 1 秒。上一节的程序做以下改动:
- 第 5 行的第 2 个 int 改为 long long
- 第 8 和 19 行的 int 改为 long long
- 第 20 行的 %d 改为 %lld
就可以适用于这道题目,但是运行结果是“Time limit exceeded”。此时,需要更好的算法。我们有以下 C 语言程序(1593.c):
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 | // http://acm.timus.ru/problem.aspx?space=1&num=1593 #include <stdio.h> #include <math.h> int compute( long long n) { int i, k; long long i2; while ((n & 3) == 0) n >>= 2; if ((n & 7) == 7) return 4; for (i = 8, i2 = 9; i2 <= n; i2 += i += 8) while (n % i2 == 0) n /= i2; if (n == 1) return 1; if ((n & 1) == 0) n >>= 1; if ((n & 3) == 3) return 3; for (k = sqrt (n), i = 3; i <= k && n % i; i += 4) ; return (i > k) ? 2 : 3; } int main( void ) { long long n; scanf ( "%lld" , &n); printf ( "%d" , compute(n)); return 0; } |
在上述程序中:
- 第 9 行消去 n 的所有值为 4 因数。
- 第 10 行检测 n 是否为 8m + 7 的形式,如是,直接返回 4 (请参见下节)。
- 第 11、12 行消去 n 的所有素因子的偶次幂(素因子 2 的偶次幂已经在第 9 行消去了)。
- 第 11 行中 i2 依次为:32、52、72、...、t2,这是因为 (t + 1)2 - (t - 1)2 = 4t,每次循环 t 增加 2,所以 i 增加 4 * 2 = 8。
- 第 13 行,如果 n 等于 1,说明输入是个完全平方数,直接返回 1。
- 此时,n 的标准分解式中所有的素因子都是一次幂了。
- 第 14 行消去 n 的素因子 2 (如果有的话)。
- 第 16 行的循环中 i 从 3 开始,每次递增 4,以检查 n 是否有 4m + 3 形式的因子。
- 第 15 行和第 17 行根据定理 366 决定答案是两个还是三个平方之和。
这个程序在 Timus Online Judge 网站的运行时间是 0.828 秒。这道题目的最佳运行时间是 0.031 秒,不知道使用什么算法可以这么快。
上述算法的原理
《数论导引(第5版)》第 329 页说:
第 318 页有以下定理:
定理 366: 一个数 n 是两个平方之和,当且仅当在 n 的标准分解式中,它的所有形如 4m + 3 的素因子都有偶次幂
我们还有以下定理:
形如 4m + 3 的整数有形如 4m + 3 的素因子
列出平方数
前面的 1593.c 程序只能给出答案是几个平方数之和,而对这些平方数是什么一无所知。而 1073.c 程序倒是中规中矩地想要求解这些平方数是什么,但是从 Lagrange 定理得知最多只要四个平方数就够了,所以该程序只求解到三个平方数的情况,其余情况下答案肯定是 4 了。因此,我们将 1073.c 稍做修改,得到 1073b.c 用于列出这些平方数,如下所示:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 | #include <stdio.h> #include <stdlib.h> #include <math.h> static int a[5]; int compute( int n) { int i, j, k, l, m = 5; int i0 = n / 4, i2 = n, j2, k2, l2; for (i = sqrt (n); i2 > i0; i--) if ((j2 = n - (i2 = i * i)) == 0) return a[0] = i, 1; else for (j = sqrt (j2); j > 0; j--) if ((k2 = n - i2 - (j2 = j * j)) == 0) return a[0] = i, a[1] = j, 2; else for (k = sqrt (k2); k > 0; k--) if ((l2 = n - i2 - j2 - (k2 = k * k)) == 0 && m > 3) a[0] = i, a[1] = j, a[2] = k, m = 3; else if (l = sqrt (l2), l * l == l2 && m > 4) a[0] = i, a[1] = j, a[2] = k, a[3] = l, m = 4; return m; } int main( int args, char * argv[]) { int i, n, start = 1, count = 16, k; if (args > 1) start = atoi (argv[1]); if (args > 2) count = atoi (argv[2]); for (n = start; n < start + count; n++) { k = compute(n); printf ( "%d:%6d:" , k, n); for (i = 0; i < k; i++) printf ( " %d" , a[i]); puts (k > 4 ? " Error!" : "" ); } return 0; } |
上述程序中:
- 第 5 行的全局静态数组用于记录所求的平方数,数组大小为 5, 而不是 4,是为了防止程序有 bug 时造成数组下标越界(第 32 行)。
- 第 9 行将 m 的初值从 4 改为 5,用以检测程序是否有 bug。
- 第 9、10 行增加了变量 l 和 l2 用于计算第四个平方数,并相应增加一层循环(第 15 行)。
- 第 12、14、17 和 19 行相应记录这些平方数于数组 a 中。
- 第 33 行在输出时检查程序是否有 bug。如果 k > 4 程序肯定有问题,违反了 Lagrange 定理。当然,k <= 4 并不意味着程序就没有问题了。:)
这个程序的运行结果如下所示:
E:\work> 1073b 1: 1: 1 2: 2: 1 1 3: 3: 1 1 1 1: 4: 2 2: 5: 2 1 3: 6: 2 1 1 4: 7: 2 1 1 1 2: 8: 2 2 1: 9: 3 2: 10: 3 1 3: 11: 3 1 1 3: 12: 2 2 2 2: 13: 3 2 3: 14: 3 2 1 4: 15: 3 2 1 1 1: 16: 4 E:\work> 1073b 100001 9 3:100001: 316 12 1 3:100002: 316 11 5 3:100003: 315 27 7 3:100004: 316 12 2 3:100005: 316 10 7 3:100006: 311 57 6 4:100007: 315 27 7 2 3:100008: 314 34 16 2:100009: 315 28 E:\work> 1073b 987654 3:987654: 991 58 47 4:987655: 993 39 9 2 2:987656: 734 670 3:987657: 992 53 28 3:987658: 993 40 3 3:987659: 991 67 33 3:987660: 986 110 58 3:987661: 990 75 44 3:987662: 993 38 13 4:987663: 993 38 13 1 2:987664: 992 60 3:987665: 993 40 4 3:987666: 992 59 11 3:987667: 993 33 23 3:987668: 992 60 2 2:987669: 990 87 E:\work>
如果不知道 Lagrange 定理,也就是说,假设我们不知道要多少个平方数之和才够的话,这道题目看来只好用动态规划算法来求解了。
使用递归求解
键盘农夫园友在 47 楼的评论中介绍了他的随笔“华丽的递归——将正整数表示为平方数之和”。我将该随笔中的 C 语言程序改写如下(1073c.c):
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 | // http://acm.timus.ru/problem.aspx?space=1&num=1073 #include <stdio.h> typedef int bool ; const bool true = 1; const bool false = 0; bool isSquare( int n, int v, int k) { return (n < v) ? false : (n == v) ? true : isSquare(n, v + k + 2, k + 2); } bool isSquareSum( int n, int m, int v, int k) { if (n < v) return false ; if (m == 1) return isSquare(n, v, k); return isSquareSum(n - v, m - 1, v, k) ? true : isSquareSum(n, m, v + k + 2, k + 2); } int compute( int n, int m) { return isSquareSum(n, m, 1, 1) ? m : compute(n, m + 1); } int main( void ) { int n; scanf ( "%d" , &n); printf ( "%d" , compute(n, 1)); return 0; } |
这个程序本质上和键盘农夫园友的程序是没有区别的。分析如下:
- 第 9 到 12 行的 isSquare 函数判断 n 是否是不小于 v 的完全平方数。其中 k 是用于计算平方数的辅助变量。
- 第 14 到 19 行的 isSquareSum 函数判断 n 是否是 m 个不小于 v 的平方数之和。其中 k 是用于计算平方数的辅助变量。
- 第 21 到 24 行的 compute 函数计算正整数 n 最少可以表示为多少个平方数之和。
上述程序在 Timus Online Judge 网站的运行时间是 0.031 秒,而第一小节中的 1073.c 的运行时间是 0.015 秒。
如果将上述程序作如下改动:
- 第 9 行的前两个 int 改为 long long
- 第 14 行的第 1 个和第 3 个 int 改为 long long
- 第 21 行的第 2 个 int 改为 long long
- 第 28 行的 int 改为 long long
- 第 29 行的 %d 改为 %lld
就可以适用于“1593. Square Country. Version 2”,但是运行结果是“Crash (stack overflow)”。
更多的 ACM 题的解法请参见:Timus 目录。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· [AI/GPT/综述] AI Agent的设计模式综述