2017 年 5月 25 日随笔档案 - bonelee

2017年5月25日

摘要：看了下压缩算法的发展历史，根据倒排索引的数据结构特点，个人认为zstd不适合做倒排索引压缩，举例说明下：假设有一份文档倒排列表为：[300, 302, 303, 332]，对于这组倒排数据，是没法***直接***采用zstd这类字典压缩算法的，因为里面没有重复数据（字典压缩通常重复数据较多，例如一阅读全文

posted @ 2017-05-25 15:25 bonelee 阅读(1155) 评论(0) 推荐(0) 编辑

无损压缩算法历史

摘要：引言无损压缩算法可行的基本原理是，任意一个非随机文件都含有重复数据，这些重复数据可以通过用来确定字符或短语出现概率的统计建模技术来压缩。统计模型可以用来为特定的字符或者短语生成代码，基于它们出现的频率，配置最短的代码给最常用的数据。这些技术包括熵编码(entropy encoding)，游程编码( 阅读全文

posted @ 2017-05-25 15:00 bonelee 阅读(2870) 评论(0) 推荐(0) 编辑

无损压缩算法历史——熵编码是最早出现的，后来才有Lzx这些压缩算法

摘要： Unary Arithmetic Asymmetric Numeral Systems Golomb Huffman Adaptive Canonical Modified Range Shannon Shannon–Fano Shannon–Fano–Elias Tunstall Universa 阅读全文

posted @ 2017-05-25 14:57 bonelee 阅读(1226) 评论(0) 推荐(0) 编辑

将者，智、信、仁、勇、严也。

Hi，我是李智华，华为-安全AI算法专家，欢迎来到安全攻防对抗的有趣世界。

公告