BitMap

概述

  所谓bitmap就是用一个bit位来标记某个元素对应的value,而key即是这个元素。由于采用bit为单位来存储数据,因此在可以大大的节省存储空间。

算法思想

  32位机器上,一个整形,比如int a;在内存中占32bit,可以用对应的32个bit位来表示十进制的0-31个数,bitmap算法利用这种思想处理大量数据的排序与查询。
优点:
  • 效率高,不许进行比较和移位
  • 占用内存少,比如N=10000000;只需占用内存为N/8 = 1250000Bytes = 1.2M,如果采用int数组存储,则需要38M多
缺点:
  • 无法对存在重复的数据进行排序和查找
  示例:申请一个int型的内存空间,则有4Byte,32bit。输入 4, 2,  1,  3时:
  输入4:

  输入2:

  输入1:

  输入3:

  思想比较简单,关键是十进制和二进制bit位需要一个map映射表,把10进制映射到bit位上

map映射表

  假设需要排序或者查找的总数N=10000000,那么我们需要申请的内存空间为 int a[N/32 + 1].其中a[0]在内存中占32位,依此类推。bitmap表为:
    a[0] ------> 0 - 31
    a[1] ------> 32 - 63
    a[2] ------> 64 - 95
    a[3] ------> 96 - 127
    ......
  下面介绍用位移将十进制数转换为对应的bit位

位移转换

  1.   求十进制数0-N对应的在数组a中的下标:index_loc = N / 32即可,index_loc即为n对应的数组下标。例如n = 76, 则loc = 76 / 32 = 2,因此76在a[2]中。:
  2. 求十进制数0-N对应的bit位:bit_loc = N % 32即可,例如 n = 76, bit_loc = 76 % 32 = 12
  3. 利用移位0-31使得对应的32bit位为1

代码示例JAVA

public class BitMap {
    private int[] arr;
    public BitMap(long maxNum) {
        long lenght=maxNum/32+1;
        arr=new int[(int) lenght];
        for (int i = 0; i < arr.length; i++) {
            arr[i]=0;//初始化数组全为0
        }
    }

    //改方法将n对应的bit位设为1
    //参数n:将要处理的数据
    //arr[]:int类型数字用于存储bit位
    private static void set(int n,int[] arr){
        int int_loc,bit_loc;
        int_loc=n>>5;//计算n对应bit在数组中的索引
        bit_loc=n&0x1f;//计算n在arr[int_loc]对应的bit位
        arr[int_loc]|=1<<bit_loc;//将n对应的bit为记为1;
    }
    
    private int testBit(int n,int[] arr){
        int i;
        int result;
        i=1<<(n&0x0f);
        result=arr[n>>5]&i;
        return result;
    }

    public static void main(String[] args) {
        long maxNum=Long.MAX_VALUE;
        BitMap bitMap=new BitMap(maxNum);
    }
}
View Code

 

附加:Java中的位运算

public static void main(String[] args) {
	// 1、左移( << ) 
	//0000 0000 0000 0000 0000 0000 0000 0101 然后左移2位后,低位补0:
	//0000 0000 0000 0000 0000 0000 0001 0100 换算成10进制为20
	System.out.println(5 << 2);// 运行结果是20

	// 2、右移( >> ) 高位补符号位
	// 0000 0000 0000 0000 0000 0000 0000 0101 然后右移2位,高位补0:
	// 0000 0000 0000 0000 0000 0000 0000 0001
	System.out.println(5 >> 2);// 运行结果是1

	//3、无符号右移( >>> ) 高位补0
	//例如 -5换算成二进制后为:0101 取反加1为1011
	//1111 1111 1111 1111 1111 1111 1111 1011
	// 我们分别对5进行右移3位、 -5进行右移3位和无符号右移3位:
	System.out.println(5 >> 3);// 结果是0
	System.out.println(-5 >> 3);// 结果是-1
	System.out.println(-5 >>> 3);// 结果是536870911

	//4、位与( &) 
	//第一个操作数的的第n位于第二个操作数的第n位如果都是1,那么结果的第n为也为1,否则为0
	System.out.println(5 & 3);// 结果为1
	System.out.println(4 & 1);// 结果为0

	//5、位或( | )
	//第一个操作数的的第n位于第二个操作数的第n位只要有一个是1,那么结果的第n为也为1,否则为0
	System.out.println(5 | 3);// 结果为7

	// 6、位异或( ^ )
	// 第一个操作数的的第n位于第二个操作数的第n位相反,那么结果的第n为也为1,否则为0
	System.out.println(5 ^ 3);//结果为6 

	// 7、位非( ~ )
	// 操作数的第n位为1,那么结果的第n位为0,反之。
	System.out.println(~5);// 结果为-6 
} 
posted @ 2016-07-27 20:38  简单爱_wxg  阅读(405)  评论(0编辑  收藏  举报