摘要:
来看看倒排索引压缩。压缩是拿CPU换IO的最重要手段之一,不论索引是放在硬盘还是内存中。索引压缩的算法有几十种,跟文本压缩不同,索引压缩算法不仅仅需要考虑压缩率,更要考虑压缩和解压性能,否则会解压太慢而起不到CPU换IO的作用。早期的索引设计里,在尝试了几十种编码之后,基本都确定性采用差分编码+可变 阅读全文
摘要:
格伦布编码 格伦布编码是一种无失真资料压缩方法,由数学家所罗门·格伦布在1960年代提出。 Rice编码 Robert F. Rice提出Rice 编码,是以哥伦布编码为基础做改良而更简易的前置码。Rice编码可视为适应性编码的一种或是哥伦布编码的特例之一。哥伦布编码有一个可调整参数,可以是任一正整 阅读全文
摘要:
哥伦布编码是一个针对整数的变长编码方式,详细介绍可以看维基百科。这里简单介绍下: 哥伦布编码使用指定的整数 M 把输入的整数分成两部分:商数 q、余数 r。 商数当做一元编码,而余数放在后面做为可缩短的二进制编码。 将整数变为一元编码非常简单:q 的一元编码结果就是 q 个 1 加上 1 个 0。如 阅读全文
摘要:
Build cross platform desktop appswith JavaScript, HTML, and CSS Build cross platform desktop appswith JavaScript, HTML, and CSS Build cross platform d 阅读全文