统计二进制展开中数位1的个数的优化

Posted on 2015-05-02 16:52  Maples7  阅读(2012)  评论(2编辑  收藏  举报

问题:

  对于任意的非负整数,统计其二进制展开中数位1的总数。

 


 

 

解决:

  相关Blog:http://www.cnblogs.com/maples7/p/4324844.html

  在看这篇之前可以先看看上述这篇,这篇主要讨论其优化问题。

 

常规解法:

O(logn):

 1 int countOnes(unsigned int n)
 2 {
 3     int ones = 0;
 4     while (0 < n)
 5     {
 6         ones += (1 & n);
 7         n >>= 1;
 8     }
 9     return ones;
10 }

无非就是每次取其二进制展开最后一位,是1就计数。

效率由位运算可知(右移一位等价于除以2),为 O(logn)。

 

优化解法1:

O(countOnes(n)):

 1 int countOnes1(unsigned int n)
 2 {
 3     int ones = 0;
 4     while (0 < n)
 5     {
 6         ones++;            // 计数(最后至少有一位为1)
 7         n &= n - 1;        // 清除当前最靠右的1
 8     }
 9     return ones;
10 }

解释如下:

 

优化解法2:

O(logW), W = O(logn) 为整数的位宽, 实际上就是 O(1) 的算法

代码及解释:

这个算法是一种合并计数器的策略。把输入数的32Bit当作32个计数器,代表每一位的1个数。然后合并相邻的2个“计数器”,使i成为16个计数器,每个计数器的值就是这2个Bit的1的个数;继续合并相邻的2个“计数器“,使i成为8个计数器,每个计数器的值就是4个Bit的1的个数。。依次类推,直到将i变成一个计数器,那么它的值就是32Bit的i中值为1的Bit的个数。

实际上还是二分的思想,把一位一位计数变成二分的计数,使 O(logn) 变成了 O(loglogn)。

 

为了理解起来方便,代码可简化为:

 1 int BitCount4(unsigned int n) 
 2 { 
 3     n = (n &0x55555555) + ((n >>1) &0x55555555) ; 
 4     n = (n &0x33333333) + ((n >>2) &0x33333333) ; 
 5     n = (n &0x0f0f0f0f) + ((n >>4) &0x0f0f0f0f) ; 
 6     n = (n &0x00ff00ff) + ((n >>8) &0x00ff00ff) ; 
 7     n = (n &0x0000ffff) + ((n >>16) &0x0000ffff) ; 
 8 
 9     return n ; 
10 }

 

 

其他的一些有助于理解的解释有:

 

本段讲解来源:http://www.sandy-sp.com/blog/article.asp?id=11

说简单点,就是一个 错位分段相加,然后递归合并的过程 。

下面是细节分析:

首先先看看那些诡异的数字都有什么特点:
0x5555……这个换成二进制之后就是0101010101010101……
0x3333……这个换成二进制之后就是0011001100110011……
0x0f0f……...这个换成二进制之后就是0000111100001111……
看出来点什么了吗?
如果把这些二进制序列看作一个循环的周期序列的话,

那么第一个序列的周期是2,每个周期是01,第二个序列的周期是4,每个周期是0011,第三个的周期是8,每个是00001111……

这样的话,我们可以看看如果一个数和这些玩意相与之后的结果:

整个数按照上述的周期被分成了n段,每段里面的前半截都被清零,后半截保留了数据。不同在于这些数分段的长度是2倍增长的。于是我们可以姑且命名它们为“分段截取常数”。

这样,如果我们按照分段的思想,每个周期分成一段的话,你或许就可以感觉到这个分段是二分法的倒过来——类似二段合并一样的东西!


现 在回头来看问题,我们要求的是1的个数。这就要有一个清点并相加的过程(查表法除外)。使用&运算和移位运算可以帮我们找到1,但是却无法计算1 的个数,需要由加法来完成。最传统的逐位查找并相加,每次只加了1位,显然比较浪费,我们能否一次用加法来计算多次的位数呢?

再考虑问题,找到了1的位置,如何把这个位置变成数量。最简单的情况,一个2位的数,比如11,只要把它的第二位和第一位相加,不就得到了1的个数了吗?!所以对于2位的x,有x中1的个数=(x>>1)+(x&1)。是不是和上面的式子有点像?

再考虑稍复杂的,一个字节内的情况。
一个字节的x,显然不能用(x>>1)+(x&1)的方法来完成,但是我们受到了启发,如果把x分段相加呢?把x分成4个2位的段,然后相加,就会产生4个2位的数,每个都代表了x对应2位地方的1的个数。

 

例子一:(来源:http://www.sandy-sp.com/blog/article.asp?id=11)


例子,若求156中1的个数,156二进制是10011100
最终:

[1][0][0][1][1][1][0][0] //初始,每一位是一组
---
|0  0 |0  1 |0  1 |0  0|  //与01010101相与的结果,同时2个一组分组
+
|0  1 |0  0 |0  1 |0  0|  //右移一位后与01010101相与的结果
=
[0  1][0  1][1  0][0  0]  //相加完毕后,现在每2位是一组,每一组保存的都是最初在这2位的1的个数
----
|0  0  0  1 |0  0  0  0|  //与00110011相与的结果,4个一组分组
+
|0  0  0  1 |0  0  1  0|  //右移两位后与00110011相与的结果
=
[0  0  1  0][0  0  1  0] //相加完毕后,现在每4位是一组,并且每组保存的都是最初这4位的1的个数
----
|0  0  0  0  0  0  1  0|
+
|0  0  0  0  0  0  1  0|
=
[0  0  0  0  0  1  0  0] //最终合并为8位1组,保存的是整个数中1的个数,即4。

 

再举一个例子:(来源:http://www.cnblogs.com/xianghang123/archive/2011/08/24/2152408.html)

比如这个例子,143的二进制表示是10001111,这里只有8位,高位的0怎么进行与的位运算也是0,所以只考虑低位的运算,按照这个算法走一次

+---+---+---+---+---+---+---+---+
| 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |   <---143
+---+---+---+---+---+---+---+---+
|  0 1  |  0 0  |  1 0  |  1 0  |   <---第一次运算后
+-------+-------+-------+-------+
|    0 0 0 1    |    0 1 0 0    |   <---第二次运算后
+---------------+---------------+
|        0 0 0 0 0 1 0 1        |   <---第三次运算后,得数为5
+-------------------------------+

这里运用了分治的思想,先计算每对相邻的2位中有几个1,再计算每相邻的4位中有几个1,下来8位,16位,32位,因为2^5=32,所以对于32位的机器,5条位运算语句就够了。

像这里第二行第一个格子中,01就表示前两位有1个1,00表示下来的两位中没有1,其实同理。再下来01+00=0001表示前四位中有1个1,同样的10+10=0100表示低四位中有4个1,最后一步0001+0100=00000101表示整个8位中有5个1。



再举一个例子:(来源:维基百科)

例如,要计算二进制数 A=0110110010111010 中 1 的个数,这些运算可以表示为:

符号 二进制 十进制 注释
A 0110110010111010   原始数据
B = A & 01 01 01 01 01 01 01 01 01 00 01 00 00 01 00 00 1,0,1,0,0,1,0,0 A 隔一位检验
C = (A >> 1) & 01 01 01 01 01 01 01 01 00 01 01 00 01 01 01 01 0,1,1,0,1,1,1,1 A 中剩余的数据位
D = B + C 01 01 10 00 01 10 01 01 1,1,2,0,1,2,1,1 A 中每个双位段中 1 的个数列表
E = D & 0011 0011 0011 0011 0001 0000 0010 0001 1,0,2,1 D 中数据隔一位检验
F = (D >> 2) & 0011 0011 0011 0011 0001 0010 0001 0001 1,2,1,1 D 中剩余数据的计算
G = E + F 0010 0010 0011 0010 2,2,3,2 A 中 4 位数据段中 1 的个数列表
H = G & 00001111 00001111 00000010 00000010 2,2 G 中数据隔一位检验
I = (G >> 4) & 00001111 00001111 00000010 00000011 2,3 G 中剩余数据的计算
J = H + I 00000100 00000101 4,5 A 中 8 位数据段中 1 的个数列表
K = J & 0000000011111111 0000000000000101 5 J 中隔一位检验
L = (J >> 8) & 0000000011111111 0000000000000100 4 J 中剩余数据的检验
M = K + L 0000000000001001 9 最终答案

 

From : 《数据结构习题解析》,邓俊辉

Reference:

1、http://blog.chinaunix.net/uid-21275705-id-224360.html

2、http://graphics.stanford.edu/~seander/bithacks.html#CountBitsSetNaive

3、http://www.cnblogs.com/graphics/archive/2010/06/21/1752421.html