统计二进制展开中数位1的个数的优化

Posted on 2015-05-02 16:52 Maples7 阅读(2132) 评论(2) 收藏举报

问题：

　　对于任意的非负整数，统计其二进制展开中数位1的总数。

解决:

　　在看这篇之前可以先看看上述这篇，这篇主要讨论其优化问题。

常规解法：

O(logn)：

 1 int countOnes(unsigned int n)
 2 {
 3     int ones = 0;
 4     while (0 < n)
 5     {
 6         ones += (1 & n);
 7         n >>= 1;
 8     }
 9     return ones;
10 }

无非就是每次取其二进制展开最后一位，是1就计数。

效率由位运算可知（右移一位等价于除以2），为 O(logn)。

优化解法1：

O(countOnes(n))：

 1 int countOnes1(unsigned int n)
 2 {
 3     int ones = 0;
 4     while (0 < n)
 5     {
 6         ones++;            // 计数（最后至少有一位为1）
 7         n &= n - 1;        // 清除当前最靠右的1
 8     }
 9     return ones;
10 }

解释如下：

优化解法2：

O(logW), W = O(logn) 为整数的位宽, 实际上就是 O(1) 的算法。

代码及解释：

这个算法是一种合并计数器的策略。把输入数的32Bit当作32个计数器，代表每一位的1个数。然后合并相邻的2个“计数器”，使i成为16个计数器，每个计数器的值就是这2个Bit的1的个数；继续合并相邻的2个“计数器“，使i成为8个计数器，每个计数器的值就是4个Bit的1的个数。。依次类推，直到将i变成一个计数器，那么它的值就是32Bit的i中值为1的Bit的个数。

实际上还是二分的思想，把一位一位计数变成二分的计数，使 O(logn) 变成了 O(loglogn)。

为了理解起来方便，代码可简化为：

 1 int BitCount4(unsigned int n) 
 2 { 
 3     n = (n &0x55555555) + ((n >>1) &0x55555555) ; 
 4     n = (n &0x33333333) + ((n >>2) &0x33333333) ; 
 5     n = (n &0x0f0f0f0f) + ((n >>4) &0x0f0f0f0f) ; 
 6     n = (n &0x00ff00ff) + ((n >>8) &0x00ff00ff) ; 
 7     n = (n &0x0000ffff) + ((n >>16) &0x0000ffff) ; 
 8 
 9     return n ; 
10 }

其他的一些有助于理解的解释有：

本段讲解来源:http://www.sandy-sp.com/blog/article.asp?id=11

说简单点，就是一个错位分段相加，然后递归合并的过程。

下面是细节分析：

首先先看看那些诡异的数字都有什么特点：
0x5555……这个换成二进制之后就是0101010101010101……
0x3333……这个换成二进制之后就是0011001100110011……
0x0f0f……...这个换成二进制之后就是0000111100001111……
看出来点什么了吗？
如果把这些二进制序列看作一个循环的周期序列的话，

那么第一个序列的周期是2，每个周期是01，第二个序列的周期是4，每个周期是0011，第三个的周期是8，每个是00001111……

这样的话，我们可以看看如果一个数和这些玩意相与之后的结果：

整个数按照上述的周期被分成了n段，每段里面的前半截都被清零，后半截保留了数据。不同在于这些数分段的长度是2倍增长的。于是我们可以姑且命名它们为“分段截取常数”。

这样，如果我们按照分段的思想，每个周期分成一段的话，你或许就可以感觉到这个分段是二分法的倒过来——类似二段合并一样的东西！

现在回头来看问题，我们要求的是1的个数。这就要有一个清点并相加的过程（查表法除外）。使用&运算和移位运算可以帮我们找到1，但是却无法计算1 的个数，需要由加法来完成。最传统的逐位查找并相加，每次只加了1位，显然比较浪费，我们能否一次用加法来计算多次的位数呢？

再考虑问题，找到了1的位置，如何把这个位置变成数量。最简单的情况，一个2位的数，比如11，只要把它的第二位和第一位相加，不就得到了1的个数了吗？！所以对于2位的x，有x中1的个数=(x>>1)+(x&1)。是不是和上面的式子有点像？

再考虑稍复杂的，一个字节内的情况。
一个字节的x，显然不能用(x>>1)+(x&1)的方法来完成，但是我们受到了启发，如果把x分段相加呢？把x分成4个2位的段，然后相加，就会产生4个2位的数，每个都代表了x对应2位地方的1的个数。

例子一：（来源：http://www.sandy-sp.com/blog/article.asp?id=11）

例子，若求156中1的个数，156二进制是10011100
最终：

[1][0][0][1][1][1][0][0] //初始，每一位是一组
---
|0  0 |0  1 |0  1 |0  0|  //与01010101相与的结果，同时2个一组分组
+
|0  1 |0  0 |0  1 |0  0|  //右移一位后与01010101相与的结果
=
[0  1][0  1][1  0][0  0]  //相加完毕后，现在每2位是一组，每一组保存的都是最初在这2位的1的个数
----
|0  0  0  1 |0  0  0  0|  //与00110011相与的结果，4个一组分组
+
|0  0  0  1 |0  0  1  0|  //右移两位后与00110011相与的结果
=
[0  0  1  0][0  0  1  0] //相加完毕后，现在每4位是一组，并且每组保存的都是最初这4位的1的个数
----
|0  0  0  0  0  0  1  0|
+
|0  0  0  0  0  0  1  0|
=
[0  0  0  0  0  1  0  0] //最终合并为8位1组，保存的是整个数中1的个数，即4。

再举一个例子：（来源：http://www.cnblogs.com/xianghang123/archive/2011/08/24/2152408.html）

比如这个例子，143的二进制表示是10001111，这里只有8位，高位的0怎么进行与的位运算也是0，所以只考虑低位的运算，按照这个算法走一次

+---+---+---+---+---+---+---+---+
| 1 | 0 | 0 | 0 | 1 | 1 | 1 | 1 |   <---143
+---+---+---+---+---+---+---+---+
| 0 1 |  0 0 | 1 0  |  1 0  |   <---第一次运算后
+-------+-------+-------+-------+
|    0 0 0 1    |    0 1 0 0    |   <---第二次运算后
+---------------+---------------+
|        0 0 0 0 0 1 0 1        |   <---第三次运算后，得数为5
+-------------------------------+

这里运用了分治的思想，先计算每对相邻的2位中有几个1，再计算每相邻的4位中有几个1，下来8位，16位，32位，因为2^5＝32，所以对于32位的机器，5条位运算语句就够了。

像这里第二行第一个格子中，01就表示前两位有1个1，00表示下来的两位中没有1，其实同理。再下来01+00=0001表示前四位中有1个1，同样的10+10=0100表示低四位中有4个1，最后一步0001+0100=00000101表示整个8位中有5个1。

再举一个例子：（来源：维基百科）

例如，要计算二进制数 A=0110110010111010 中 1 的个数，这些运算可以表示为：

符号	二进制	十进制	注释
A	0110110010111010		原始数据
B = A & 01 01 01 01 01 01 01 01	01 00 01 00 00 01 00 00	1,0,1,0,0,1,0,0	A 隔一位检验
C = (A >> 1) & 01 01 01 01 01 01 01 01	00 01 01 00 01 01 01 01	0,1,1,0,1,1,1,1	A 中剩余的数据位
D = B + C	01 01 10 00 01 10 01 01	1,1,2,0,1,2,1,1	A 中每个双位段中 1 的个数列表
E = D & 0011 0011 0011 0011	0001 0000 0010 0001	1,0,2,1	D 中数据隔一位检验
F = (D >> 2) & 0011 0011 0011 0011	0001 0010 0001 0001	1,2,1,1	D 中剩余数据的计算
G = E + F	0010 0010 0011 0010	2,2,3,2	A 中 4 位数据段中 1 的个数列表
H = G & 00001111 00001111	00000010 00000010	2,2	G 中数据隔一位检验
I = (G >> 4) & 00001111 00001111	00000010 00000011	2,3	G 中剩余数据的计算
J = H + I	00000100 00000101	4,5	A 中 8 位数据段中 1 的个数列表
K = J & 0000000011111111	0000000000000101	5	J 中隔一位检验
L = (J >> 8) & 0000000011111111	0000000000000100	4	J 中剩余数据的检验
M = K + L	0000000000001001	9	最终答案

From : 《数据结构习题解析》，邓俊辉

Reference：

1、http://blog.chinaunix.net/uid-21275705-id-224360.html

2、http://graphics.stanford.edu/~seander/bithacks.html#CountBitsSetNaive

3、http://www.cnblogs.com/graphics/archive/2010/06/21/1752421.html

刷新页面返回顶部