会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
游园惊梦(https://github.com/chenghuige)
博客园
首页
新随笔
联系
订阅
管理
2009年11月21日
C++实现的huffman与canonical huffman的压缩解压缩系统,支持基于单词的压缩解压缩
摘要: 我把它放在了google code上11.30完成了英文文本基于分词的范式huffman完全无损的压缩解压缩。对于24M的一个测试英文文本用普通的基于字节的压缩可压缩到13M,而基于分词的压缩当前测试是9.5M,gzip默认选项压缩到7.6M如果改进分词或者是对于更大的英文文本(这个测试文本中符号比较多稍微影响效果)基于词的压缩能取得更好的效果。下一步,改进分词,改进速度,尝试中文分词压缩,或者混...
阅读全文
posted @ 2009-11-21 00:39 阁子
阅读(1432)
评论(0)
推荐(0)
编辑
公告