[置顶] 《贴吧合伙人》——百度已经沦落到卖血为生?

摘要: 今天一早起来,发现自己管理了4、5年的百度C++吧吧主没了,3个大吧十几个小吧全部下台,之前的钢琴吧本子节事件基本已经确定百度要把贴吧完全商业化了,没想到来得这么快。。 虽说百度用产品赚钱的行为无可厚非,但是这种卖贴吧的行为,基本上能看出百度的运营和决策层的低能。贴吧做为百度主要的一个产品,其... 阅读全文

posted @ 2015-11-22 16:43 RichSelian 阅读(8331) 评论(79) 推荐(62) 编辑

2019年7月23日

用rust实现高性能的数据压缩工具

摘要: https://github.com/richox/orz [求watch/star/fork] rust是一门新兴的程序语言,有着不输C/C++的性能、简洁精练的语法和可靠的内存安全性。orz是一款用纯rust实现的数据压缩工具,以ROLZ/MTF/Huffman算法为核心,能实现以gzip更快的 阅读全文

posted @ 2019-07-23 21:57 RichSelian 阅读(1502) 评论(0) 推荐(0) 编辑

2016年1月6日

高性能的数据压缩库libzling-20160105

摘要: libzling(https://github.com/richox/libzling,求观看[watch],求星[star],求叉[fork])是一款高性能的数据压缩库,参见原贴:http://www.cnblogs.com/richselian/p/3626287.html。本次更新加入了一个简... 阅读全文

posted @ 2016-01-06 17:45 RichSelian 阅读(815) 评论(0) 推荐(2) 编辑

2014年3月26日

高性能的数据压缩库libzling-20140324

摘要: libzling(https://github.com/richox/libzling,求观看[watch],求星[star],求叉[fork])是一款高性能的数据压缩库,在压缩时间和压缩率上都超过了流行的zlib/gzip。libzling使用的是ROLZ字典算法和Polar编码,这两个算法的说明可以参考这两篇文章: http://www.cnblogs.com/richselian/archive/2012/11/10/2764427.html http://www.cnblogs.com/richselian/archive/2012/11/09/2763162.html 上次... 阅读全文

posted @ 2014-03-26 18:31 RichSelian 阅读(1615) 评论(7) 推荐(2) 编辑

2014年2月5日

高性能的数据压缩库libzling

摘要: libzling(https://github.com/richox/libzling)是一款高性能的数据压缩库,在压缩时间和压缩率上都超过了流行的zlib/gzip。libzling使用的是ROLZ字典算法和Polar编码,这两个算法的说明可以参考这两篇文章:http://www.cnblogs.com/richselian/archive/2012/11/10/2764427.html、http://www.cnblogs.com/richselian/archive/2012/11/09/2763162.html。 libzling使用的是1阶ROLZ字典编码和0阶Polar编码,... 阅读全文

posted @ 2014-02-05 22:06 RichSelian 阅读(3119) 评论(13) 推荐(2) 编辑

2012年11月10日

数据压缩之ROLZ字典编码

摘要: 在字典编码中,最常用的恐怕要算LZ77编码了。LZ77的思想很简单,就是用一个<offset, length>元组来表示当前位置的字节串在前offset个字节中出现过。正是由于这个简单的思想,所有基于LZ77实现的实用算法都有着不错的解压速度。经典的使用LZ77编码的压缩算法有zip/gz的deflate算法,7z的lzma算法等。 在对LZ77算法研究中,我们也发现算法中的一些不足之处,LZ77最明显的不足是offset值的过度零散导致对<offset, length>元组的后续处理效果不好。例如处理一个16MB的数据块,一个<offset, length> 阅读全文

posted @ 2012-11-10 20:16 RichSelian 阅读(3062) 评论(4) 推荐(0) 编辑

2012年11月9日

数据压缩之Polar编码实现详解

摘要: Polar编码与范式Huffman编码类似,也是根据一个静态频率统计表来为各个符号分配前缀码来实现压缩。但Polar编码的构造算法不需要用Huffman的树结构,实现起来非常简单,而且大多数情况下压缩效果不会比Huffman差多少。 Polar编码和范式Huffman编码的差别只在计算每个符号的编码长度上,这里举一个例子说明Polar编码的算法: 假设拿到这样一个频率表: 符号 频率 A 190 B 38 C 185 D 70 E 253 Total 736 首先要按每个符号的频率... 阅读全文

posted @ 2012-11-09 19:15 RichSelian 阅读(2819) 评论(0) 推荐(1) 编辑

2012年4月14日

距离最长的有序对问题

摘要: 问题描述: 给定一个无序数组A[0..N-1],求出它的最长子串A[j..k],满足Aj < Ak。算法0: 直接枚举j、k,时间复杂度是O(n^2)。算法1: 注意到一个性质,对于子串A[i..j..m],如果有Ai <= Aj,那么A[i..j..m]必然优于A[j..m],j就不可能是起始点。所以所求子串的起始点j必然满足Ai > Aj (i < j),以下是求出所有起始点的算法:head_pos = [0]min = A[0] for i in range(1..N): if A[i] < min: head_pos.append(i... 阅读全文

posted @ 2012-04-14 16:30 RichSelian 阅读(304) 评论(0) 推荐(0) 编辑

2012年1月4日

极度简化版 HeapSort

摘要: 看了网上很多HeapSort版本实现都很复杂,其实HeapSort是完全可以只用一个循环在10行内解决的,先上代码:void heapsort(int* array, int size) { int top = size; int bot = size; int cur; int nxt = size; while(cur = nxt, bot > 0) { if(cur * 2 + 1 < bot && array[nxt] < array[cur * 2 + 1]) nxt = cur * 2 + 1; if(cur * 2 + 2... 阅读全文

posted @ 2012-01-04 12:22 RichSelian 阅读(1714) 评论(2) 推荐(2) 编辑

2011年9月16日

排序算法之 Slow Sort

摘要: Slow Sort (cpp_slow_sort.cc)================================================================================最好时间复杂度 O(nlogn)平均时间复杂度 O(nlogn)最坏时间复杂度 O(n^2)空间复杂度 O(n)是否稳定 是 Slow Sort是我自创的一种排序法,原理和也是使用折半查找的插入排序并减少调整位置所需的时间,与Library Sort不同的是我采用的是链式的方法,使用一个辅助next域支持原数组在内部进行交换排序,结构比Library Sort... 阅读全文

posted @ 2011-09-16 19:14 RichSelian 阅读(842) 评论(0) 推荐(0) 编辑

导航