要心中有“数”——C语言初学者代码中的常见错误与瑕疵(8)

　　在 C语言初学者代码中的常见错误与瑕疵(7) 中，我给出的重构代码中存在BUG。这个BUG是在飞鸟_Asuka网友指出“是不是时间复杂度比较大”，并说他“第一眼看到我就想把它当成一个数学问题来做”之后，我又重新对问题进行了数学式的思考后发现的。
　　这个BUG源于在(1<=A,B<=1000)条件下对矩形个数的数量级心里没数。当时觉得这个题目的目的是考察穷举，由于题目限定了A、B的范围，所以结果应该不是很大。事实证明这种想法是一厢情愿。
　　通常情况下，我不喜欢用数学方法解决C语言编程问题。因为很多问题，一旦在数学上能够轻易解决，编写代码往往是索然无趣的，对学习和练习C语言几乎没有什么益处。譬如，求1+2+3+……+100，如果不知道或假装不知道数学解法，代码可能是这样的

#include <stdio.h>

int main( void )
{
  int i , sum = 0 ;
  
  for ( i = 1 ; i <=100 ; i ++ )
  {
     sum += i ;
  }
  printf("%d\n",sum);
  
  return 0;
}

　　而若使用数学方法，代码则是

#include <stdio.h>

int main( void )
{
  printf("%d\n", (1 + 100) * 100 / 2 );
  
  return 0;
}

　　前者，C语言和编程成分的含量很高，数学含量却很低；而后者数学含量很高，可C语言和编程成分的含量几乎为0。
　　从解决实际问题的角度来说，显然应该用后一种方法；而从学习C语言和练习编程的角度来说，则应该使用前一种方法。所以一个好的编程问题，应该是没有数学解的，至少应该没有显而易见、容易得到的数学解。否则，只是用C语言对公式做一个简单的翻译(这大概是FORTRAN语言的哲学)，编程的味道就全没有了，谭浩强的很多题目就是如此(参见：滥用变量综合症)。“矩形的个数”问题应该说还不是那么容易得到数学解的。
　　所以，在飞鸟_Asuka 网友说他“第一眼看到我就想把它当成一个数学问题来做”之后,我也尝试着用数学的方式思考了一下。我发现，在同一条直线上的n个不同的点一共可以构成(n-1)n/2条不同的线段，A*B的矩形相邻两边各有A+1和B+1个不同的点，因而可以分别构成(A+1)A/2和(B+1)B/2条不同的线段，这样构成的矩形的个数一共就是(A+1)A/2×(B+1)B/2个。当A和B取最大值1000时，结果显然不小于25×10¹⁰，而这个值显然大于2³¹-1，甚至也大于2³²-1(多数编译器中 unsigned 类型所能表示的最大整数)。这样，原来的重构代码中用int类型作为结果的类型，显然错了。
　　我一向认为C语言程序员应该心中有“数”，即对表达式中的数据和结果有最起码的范围估计。没想到，这次由于刻意回避数学解法，却立刻遭到了违背信条的报应。正应验了Muphry's law所言：Anything that can go wrong, will go wrong。
　　冯诺依曼也认为程序员至少应该清楚计算过程中数据的数量级，为此他反对浮点数。与之相反，约翰.巴科斯则盲目乐观地发明了浮点数，很多程序员尽情地享受浮点数的方便，却由于盲目乐观屡屡被浮点数这种“有缺陷的抽象”所伤。更有甚至，很多程序员连浮点数最基本的原理都不懂，竟然能写出k=sqrt(n) 这样狗屁不通的句子。（参见：似是而非的k=sqrt(n)）
　　回过头来再谈我代码的BUG。这个BUG的另一个教训是没有进行比较充分的测试，如果测试一下边界情况可能不难发现这个BUG。后来我又重新测试了一下，发现程序运行时间比较长，这说明飞鸟_Asuka 网友指出“是不是时间复杂度比较大”的问题也是存在的。但当时为了算法叙述的方便，就没有按照下面的方法写count()函数：

int count( int A , int B )
{
   int x1 , y1 ;//第一个点的坐标 
   int x2 , y2 ;//第二个点的坐标
   int num = 0 ;
   
   for ( x1 = 0 ; x1 < B ; x1 ++ )//   for ( x1 = 0 ; x1 <= B ; x1 ++ )
      for ( y1 = 0 ; y1 < A ; y1 ++ )//     for ( y1 = 0 ; y1 <= A ; y1 ++ )//穷举第一个点的各种可能 
         for ( x2 = x1 + 1 ; x2 <= B ; x2 ++ )//    for ( x2 = 0 ; x2 <= B ; x2 ++ )
            for ( y2 = y1 + 1 ; y2 <= A ; y2 ++ )//     for ( y2 = 0 ; y2 <= A ; y2 ++ )//穷举第二个点的各种可能 
                  num ++ ;                //            {
                                          //               if ( x1 < x2 && y1 < y2 )
                                          //                   num ++ ;
                                          //            }
   return num ;
}

　　如果写成这种形式，不难发现第二层循环与第三层是可以对调的，对调后为：

   for ( x1 = 0 ; x1 < B ; x1 ++ )
      for ( x2 = x1 + 1 ; x2 <= B ; x2 ++ )
         for ( y1 = 0 ; y1 < A ; y1 ++ )
            for ( y2 = y1 + 1 ; y2 <= A ; y2 ++ )
                  num ++ ;

　　这时应该能够看出，最内两层循环次数为 A + A-1 + A-2 +……+1，最外两层循环的循环次数为B + B-1 + B-2 +……+1，因而结果可以直接得到，即(A+1)A/2*(B+1)B/2。

　　算法问题解决了，又产生了新的问题，那就是如何表示这么大的整数，这是一个数据结构的问题。（或许，这才是题目的本意？）
　　办法之一就是使用表示范围更大的整数类型，例如C99中的long long int类型。
　　如果编译器不支持C99也没有表示范围更大的整数类型，那就只有自己着手构造新的数据结构了。
　　矩形个数的最大值大约为25×10¹⁰，这并不是一个很大的数，一个int不够，那就用两个好了。这里把存储大数的数据结构设计为一数组，

typedef int BIG_NUM[2] ;

　　数组的第0个元素存储低6位，第1个元素存储高位。存储低6位的原因是避免乘法运算时溢出(乘数不超过1001，与一个6十进制整数相乘不超过10⁹，在int类型的表示范围之内)。

　　通过调用

BIG_NUM num ;
count( num , A , B );

将结果写到num中。

count()函数的实现：

void count( BIG_NUM m , int A , int B )
{
   m[0] = 1 ;
   m[1] = 0 ;
   mul_sum( m , A );//将1+2+……+A的结果乘入m 
   mul_sum( m , B );//将1+2+……+B的结果乘入m
}

　　由于结果是累乘得到的，所以初始化为1。为防止溢出，只能

void mul_sum( BIG_NUM m , int n )
{
   int t1 = n % 2 == 0 ? n / 2 : n , 
       t2 = n % 2 != 0 ? (n + 1) / 2 : n + 1 ;
   mul( m , t1 );
   mul( m , t2 );
}

　　小心翼翼地一个个地乘(每个乘数都不得超过1001)。t1，t2这两个变量是为了回避BIG_NUM类型的除法运算。

void mul( BIG_NUM m , int n )
{   
   m[0] *= n ;
   m[1] *= n ;
   m[1] += m[0]/1000000;//进位 
   m[0] %= 1000000;
}

　　每乘以一个数，立刻就处理进位问题。
　　最后还要考虑如何输出：

void output( BIG_NUM m )
{
   if ( m[1] == 0 )
   {
      printf( "%d\n" , m[0] );
      return ;
   }
   
   printf( "%d" , m[1] );
   printf( "%06d\n" , m[0] );
   
}

　　这里的"%06"是为了保证低位不够6位时仍能正确输出。

　　完整的代码如下：

/*
矩形的个数 
在一个3*2的矩形中，可以找到6个1*1的矩形，4个2*1的矩形3个1*2的矩形，
2个2*2的矩形，2个3*1的矩形和1个3*2的矩形，总共18个矩形。 
给出A，B,计算可以从中找到多少个矩形。 

输入： 
本题有多组输入数据（<10000），你必须处理到EOF为止 
输入2个整数A,B(1<=A,B<=1000) 

输出： 
输出找到的矩形数。 

样例：

输入： 
1 2 
3 2 

输出： 
3 
18

作者：薛非
出处：http://www.cnblogs.com/pmer/   “C语言初学者代码中的常见错误与瑕疵”系列博文 

*/

#include <stdio.h>
typedef int BIG_NUM[2] ;

void count( BIG_NUM , int , int ); 
void mul_sum( BIG_NUM , int );
void mul( BIG_NUM , int );
void output( BIG_NUM );

#define POW 1000000
#define WID 6

int main( void )
{
  int A , B ;

  while ( printf( "输入2个整数A,B(1<=A,B<=1000)\n" ),
          scanf( "%d%d" , &A , &B )!= EOF    
        )
  {
     BIG_NUM num ;
     count( num , A , B );
     output( num );
  }
  
  return 0;
}

void output( BIG_NUM m )
{
   if ( m[1] == 0 )
   {
      printf( "%d\n" , m[0] );
      return ;
   }
   
   printf( "%d" , m[1] );
   printf( "%0*d\n" , WID , m[0] );
   
}

void mul( BIG_NUM m , int n )
{   
   m[0] *= n ;
   m[1] *= n ;
   m[1] += m[0]/POW;//进位 
   m[0] %= POW;
}

void count( BIG_NUM m , int A , int B )
{
   m[0] = 1 ;
   m[1] = 0 ;
   mul_sum( m , A );//将1+2+……+A的结果乘入m 
   mul_sum( m , B );//将1+2+……+B的结果乘入m
}

void mul_sum( BIG_NUM m , int n )
{
   int t1 = n % 2 == 0 ? n / 2 : n , 
       t2 = n % 2 != 0 ? (n + 1) / 2 : n + 1 ;
   mul( m , t1 );
   mul( m , t2 );
}

　　写的有点丑。

posted @ 2013-12-16 15:31 garbageMan 阅读(1270) 评论(0) 编辑收藏举报

刷新页面返回顶部

garbageMan

要心中有“数”——C语言初学者代码中的常见错误与瑕疵(8)

公告