7-bit整数(Integer)压缩算法
7-bit 压缩法,针对Integer数据的一种压缩算法,可以将4个字节的Int型数据压缩为1~5个字节,数值越小,压缩后的字节数越少,所以对值小的Int型数据会有比较好的压缩效果,其具体压缩原理,算法如下:
- 将一个Int型数据转换成32位;
- 0~6位,按原值写入;
- 如果原值的第7位及以后存在1,则转换后的byte的最高位写入1,否则写入0,结束写入(即压缩为了1个字节) ;
- 如果没结束,则写入原值的第7~13位,如果原值的第14位及以后存在1,则转换后byte的最高位写入1,否则写入0,结束写入 ;
- 重复上述行为,直到写完为止 。
1:在一个字节数据中只保存7bit有效数据,第8位作为一个INT数据是否表示完成的指示位(1表示未完成,0表示已经完成)。
2:通过判断字节的最高BIT位是否为0来获取一个INT型数据,这样我们可以通过1-5个字节数据来表示一个INT型。
3:数据转换通过去除每个字节的指示位,其它bit数据拼接构成INT数据。
一个例子:0x81 存在8个有效的数据位,由于算法中1个字节表示7BIT数据,我们只需要2个字节来表示该数据,转换后的数据表示为:1000 0001 0000 0001,第一个字节最高位为1,第二个字节最高位为0,表明存在2个字节表示该INT型,去除数据指示位,获取到数据000 0001 000 0001,转换为0X81.
快速的执行是成功的关键!