两种计算自然对数的算法比較
引言
前一段时间。我写了两篇计算自然对数的算法的随笔,分别使用椭圆θ函数-算术几何平均法和泰勒级数展开式来计算。
那么这两种算法的性能怎样呢?在參考资料[3]中有下面说法:
上面的 elliptic method 就是椭圆θ函数-算术几何平均法。Taylor's method 2 就是我使用的泰勒级数展开式。能够看出,elliptic method 在计算精度大时占绝对优势。但在计算精度小时并不占优。而在我们的应用中,要计算的 decimal 数据类型的精度仅仅有 28 位有效数字,即上面的 P = 28。看来在我们的应用中应该是 Taylor's method 2 占优。
測试程序
那么就让我们写一个 C# 程序来測试一下吧,以下就是 LogFactorialTest.cs:
1 using System; 2 using System.Diagnostics; 3 using Skyiv.Extensions; 4 5 namespace Skyiv.Test 6 { 7 sealed class LogFactorialTest 8 { 9 static void Main(string[] args) 10 { 11 var n = (args.Length > 0) ?int.Parse(args[0]) : 10; 12 Run(2); 13 Run(n); 14 } 15 16 static void Run(int n) 17 { 18 var sw = Stopwatch.StartNew(); 19 var v = LogFactorial(n); 20 sw.Stop(); 21 Console.WriteLine("{0} {1,-30}: ln({2:N0}!)", sw.Elapsed, v, n); 22 } 23 24 static decimal LogFactorial(int n) 25 { 26 var v = 0m; 27 for (var i = 1; i <= n; i++) v += ((decimal)i).Log(); 28 return v; 29 } 30 } 31 }
这个程序通过计算 ln(n!) 来測试两种计算自然对数的算法的性能。简要说明例如以下:
- 第 11 行取得用户在命令行參数指定的 n 值(如未指定。则使用默认值 10),用以计算 ln(n!)。
- 第 12 行先计算一次 ln(2!) 作热身,以便 CLR 的 JIT 先将要执行的算法代码编译为机器码。另外这两种计算自然对数的算法计算出来的 ln(2) 的值略有不同,也能够作为一个区分的标志。
- 第 24 至 29 行的 LogFactorial 方法就是用来计算 ln(n!) 的。它利用 ln(n!) = ln(1) + ln(2) + ... + ln(n) 来计算。
- 本程序使用 Stopwatch 类计时。
Linux 操作系统下编译和执行
在 Arch Linux 64-bit 操作系统的 mono 2.10.8 环境下编译和执行,结果例如以下所看到的。当中 DecimalExtensions1.cs 是參考资料[1]中的程序,DecimalExtensions2.cs 是參考资料[2]中的程序,LogFactorialTest.cs 就是上一小节的程序。
work$ dmcs --version Mono C# compiler version 2.10.8.0 work$ dmcs LogFactorialTest.cs DecimalExtensions1.cs -out:LogFactorialTest1.exe work$ dmcs LogFactorialTest.cs DecimalExtensions2.cs -out:LogFactorialTest2.exe work$ mono LogFactorialTest1.exe 10000000 00:00:00.0022244 0.6931471805599453094172321215: ln(2!) 00:01:44.7091158 151180965.48756956489842537225: ln(10,000,000!) work$ mono LogFactorialTest2.exe 10000000 00:00:00.0181903 0.6931471805599453094172321225: ln(2!) 00:03:54.9390478 151180965.48756956489842537227: ln(10,000,000!) work$ mono LogFactorialTest1.exe 100000000 00:00:00.0022159 0.6931471805599453094172321215: ln(2!) 00:17:57.6529645 1742068084.5245154532285821925: ln(100,000,000!) work$ mono LogFactorialTest2.exe 100000000 00:00:00.0133964 0.6931471805599453094172321225: ln(2!) 00:39:23.8652797 1742068084.5245154532285821925: ln(100,000,000!) work$ mono LogFactorialTest1.exe 1000000000 00:00:00.0011895 0.6931471805599453094172321215: ln(2!) 03:04:05.5218954 19723265848.226982607923141006: ln(1,000,000,000!) work$ mono LogFactorialTest2.exe 1000000000 00:00:00.0018197 0.6931471805599453094172321225: ln(2!) 05:27:32.3909935 19723265848.226982607923141007: ln(1,000,000,000!)
我们的測试程序分别使用这两种算法计算了 ln(107!)、ln(108!) 和 ln(109!) 的值。计算时间最长的将近五个半小时。
Windows 7 操作系统下编译和执行
在 Windows 7 SP1 32-bit 操作系统的 .NET Framework 4.5 环境下编译和执行:
D:\work> csc -out:LogFactorialTest1.exe LogFactorialTest.cs DecimalExtensions1.cs Microsoft(R) Visual C# 编译器版本号 4.0.30319.17929 用于 Microsoft(R) .NET Framework 4.5 版权全部 (C) Microsoft Corporation。保留全部权利。 D:\work> csc -out:LogFactorialTest2.exe LogFactorialTest.cs DecimalExtensions2.cs Microsoft(R) Visual C# 编译器版本号 4.0.30319.17929 用于 Microsoft(R) .NET Framework 4.5 版权全部 (C) Microsoft Corporation。保留全部权利。
D:\work> LogFactorialTest1 10000000 00:00:00.0034542 0.6931471805599453094172321215: ln(2!) 00:01:00.1048788 151180965.48756956489842537224: ln(10,000,000!) D:\work> LogFactorialTest2 10000000 00:00:00.0043189 0.6931471805599453094172321214: ln(2!) 00:01:47.1634292 151180965.48756956489842537225: ln(10,000,000!) D:\work> LogFactorialTest1 100000000 00:00:00.0034569 0.6931471805599453094172321215: ln(2!) 00:09:21.1743684 1742068084.5245154532285821925: ln(100,000,000!) D:\work> LogFactorialTest2 100000000 00:00:00.0045334 0.6931471805599453094172321214: ln(2!) 00:18:13.4201181 1742068084.5245154532285821924: ln(100,000,000!) D:\work> LogFactorialTest1 1000000000 00:00:00.0035446 0.6931471805599453094172321215: ln(2!) 01:36:06.8523762 19723265848.226982607923141006: ln(1,000,000,000!) D:\work> LogFactorialTest2 1000000000 00:00:00.0043396 0.6931471805599453094172321214: ln(2!) 03:05:45.9748574 19723265848.226982607923141006: ln(1,000,000,000!)
能够看出,相同的程序,在这台机器上执行速度更快。这两台机器的型号是一样的,但这台机器 CPU 的主频比前一台稍高。
执行结果分析
上面两个执行结果整理例如以下表所看到的:
可见,在我们的应用中,算法2(椭圆θ函数-算术几何平均法)比算法1(泰勒级数展开式)大约要慢一倍左右。
执行环境
第一台机器是 2010-10-13 出厂的 Lenovo ThinkCentre M6100t PC 机,软件和硬件的信息例如以下所看到的:
第二台机器的型号和第一台同样,但出厂期日稍迟。是 2011-12-02 出厂的。
对应的信息例如以下所看到的: