摘要: StevenKyleLee原创:http://blog.csdn.net/stevenkylelee/article/details/6973471转载请注明最近接到一个任务:去除图像中的噪点。图片是从扫描仪扫描进来的,色彩只有黑白二值。因为是从书本上扫描,而书本上的纸张有背景色,所以导致扫描的图片会出现一大片离散的噪点。为什么要去除噪点呢?因为噪点会干扰OCR程序对文字图片的识别。一张有噪点的、扫描进来的黑白原图如下:如何去除噪点呢?观察了好一段时间,发现,凡是一个汉字的都是一大片相连的黑色像素。而噪点都是较小块的黑色像素。是否可以通过判断黑色像素块的大小(相连的黑色像素数)来确定是一个汉字 阅读全文
posted @ 2011-11-15 09:31 Steven Kyle Lee 阅读(986) 评论(1) 推荐(0) 编辑
摘要: 工程源代码下载(VS2008)先上图 把要压缩或要解压的文件拖拽到窗口中即可。另存为编辑框是压缩或解压的输出路径。对于压缩来说,另存为路径是目标文件的路径加上一个.shc扩展名。对于解压来说,会去掉最后一个扩展名。 压缩的核心其实就是用了哈夫曼编码原理。我封装了一个哈夫曼编码类,内部使用了一个哈夫曼树类。(关于哈夫曼树类,在我这篇文章有说:http://www.cnblogs.com/StevenKyleLee/archive/2011/02/19/1958278.html) 要对一个文件进行压缩,执行如下步骤: 1.建立编码方案。第一遍扫描文件,统计这个文件中各种不同的字节出现的次数(256 阅读全文
posted @ 2011-02-22 06:47 Steven Kyle Lee 阅读(2266) 评论(2) 推荐(0) 编辑
摘要: 最近写了一个哈夫曼编码小程序。对于数据结构书上介绍的算法硬是没看懂,而只是看懂了图示,所以就用了自己的方式来做。  程序运行如下图:  写了一个哈夫曼树类。可以对任何数据进行编码。测试的话,只需要输入要进行编码的字符串就行了,会输出编码方案(就是编码后对应的01序列),对应的哈夫曼树形态,和编码结果。  我的哈夫曼树类,在内部维护了一个链式二叉树。当输入一个字符串作为要编码的对象时,做如下几步:  1.先统计各个字符出现的次数。比如:“Steven Kyle Lee”中的e出现了5次。  2.用字符和它的出现次数(作为权值),new出对应的树节点。这些节点纳入一个线性表 阅读全文
posted @ 2011-02-19 00:19 Steven Kyle Lee 阅读(1499) 评论(0) 推荐(1) 编辑