图像处理 - 随笔分类 - RubbyZhang

超平面

摘要：直线、平面在说超平面之前，先说说 Rn 空间中的直线和平面。给定 Rn 空间中的一点 p 和一非负向量 v⃗ ，满足 i=tv⃗ +p 的点 i 的集合称为 Rn 空间中的一条直线。上式中 t 是一个标量，向量 v⃗ 决定了该直线的方向。如图1所示：图1：line figure illustra 阅读全文

posted @ 2014-03-20 15:51 RubbyZhang 阅读(2007) 评论(2) 推荐(0) 编辑

[ZZ]计算机视觉、机器学习相关领域论文和源代码大集合

摘要：原文地址：[ZZ]计算机视觉、机器学习相关领域论文和源代码大集合作者：计算机视觉与模式注：下面有project网站的大部分都有paper和相应的code。Code一般是C/C++或者Matlab代码。最近一次更新：2013-1-29 一、特征提取Feature Extraction： SIFT [1] [Demo program][SIFT Library] [VLFeat] PCA-... 阅读全文

posted @ 2014-03-17 20:25 RubbyZhang 阅读(723) 评论(0) 推荐(0) 编辑

计算机视觉、模式识别方面稍微容易中的期刊

摘要：(1)pattern recognition letters, 从投稿到发表，一年半时间 (2)Pattern recognition 不好中，时间长 (3)IEICE Transactions on Information and Systems，作者中有一个必须是会员。收费高，审稿快。影响因子0.4 (4)International Journal of Pattern Recognitio... 阅读全文

posted @ 2012-09-12 15:50 RubbyZhang 阅读(851) 评论(0) 推荐(0) 编辑

Codebook 背景建模

摘要：codebook采用量化技术从时间序列中获得背景模型，能够检测像素剧烈变化、或者有移动物体或者更为复杂的背景模型。codebook为每个像素建立一个codebook，每个codebook含有一个或者多个codeword，codeword 记录背景学习的阈值、对应像素的更新时间以及访问频率等，通过这些阅读全文

posted @ 2012-07-04 10:56 RubbyZhang 阅读(2593) 评论(0) 推荐(0) 编辑

opencv 直方图反向投影

摘要：直方图反向投影式通过给定的直方图信息，在图像找到相应的像素分布区域，opencv提供两种算法，一个是基于像素的，一个是基于块的。使用方法不写了，可以参考一下几个网站：直方图反向投影参考1直方图参考2测试例子1：灰度直方图反向投影灰度直方图反向投影IplImage * image= cvLoadImage("22.jpg"); IplImage * image2= cvLoadImage("2.jpg"); int hist_size=256; float range[] = {0,255}; float* ranges[]={range}; IplIma 阅读全文

posted @ 2012-06-20 17:09 RubbyZhang 阅读(6233) 评论(1) 推荐(1) 编辑

opencv(10)图像变换之边缘检测

摘要：1.sobel算子sobel算子利用多项式计算导数的近似值，其计算公式和3*3模版如下，sobel算子结合了一些滤波的效果，对噪声有一定的鲁棒性。 opencv提供了进行sobel算子的函数，函数如下：void cvSobel( const CvArr* src, CvArr* dst, int xorder, int yorder, int aperture_size=3 );src ：输入图像. 单通道，8位或者浮点dst：输出图像. 单通道，如果是8位图像，为了防止溢出，输出必须是IPL_DEPTH_16S类型xorder： x 方向上的差分阶数 yorder ： y 方向上的差分阶数阅读全文

posted @ 2012-06-19 02:33 RubbyZhang 阅读(2784) 评论(0) 推荐(0) 编辑

opencv（9）直方图均衡化，对比，匹配

摘要：1 直方图均衡化测试1 直方图均衡化测试图像： 2 .直方图对比对比的的方法用method表示，主要由以下几种办法： CV_COMP_CORREL 相关方法：完全匹配为1，完全不匹配为-1,0是无关联 CV_COMP_CHISQR 卡尔：完全匹配是0 ，完全不匹配为无限值 CV_COMP_IN 阅读全文

posted @ 2012-06-17 00:28 RubbyZhang 阅读(3340) 评论(1) 推荐(0) 编辑

opencv（8）直方图操作

摘要：opencv中的直方图弄的一点小复杂，看了好几天还是有点不明白，尤其是后面涉及多维直方图的时候，算了还是一步一步的重新看一下吧。一直方图基本操作 1 CvHistogram int dims = 2 ； int h_bins = 8, s_bins = 8; int hist_size[] = 阅读全文

posted @ 2012-06-16 22:33 RubbyZhang 阅读(2968) 评论(1) 推荐(1) 编辑

opencv（7）图像金字塔

摘要：图像金字塔是图像中多尺度表达的一种，也是很常见的，最主要用于图像的分割。opencv中给出了图像金字塔的一些列函数，再谈openv之前先介绍下高斯金字塔和拉普拉斯金字塔 1 高斯金字塔和拉普拉斯金字塔（1）高斯金字塔是通过高斯平滑和亚采样获得一些列下采样图像，也就是说第K层高斯金字塔通过平滑、亚采阅读全文

posted @ 2012-06-10 01:27 RubbyZhang 阅读(6577) 评论(0) 推荐(1) 编辑

opencv（5）形态学操作

摘要：图像形态学一般用于阈值化后的二值图像，其实也可以用于灰度图像的处理，这篇文章主要对灰度中的应用做分析。1.膨胀与腐蚀函数void cvErode( const CvArr* src, CvArr* dst, IplConvKernel* element=NULL, int iterations=1 );//腐蚀函数void cvDilate( const CvArr* src, CvArr* dst, IplConvKernel* element=NULL, int iterations=1 );//膨胀函数函数解释可以参考：opencv论坛，关于里面的结构IplConvKernel可以参考：阅读全文

posted @ 2012-06-08 03:41 RubbyZhang 阅读(3711) 评论(0) 推荐(1) 编辑

opencv（4）图像滤波

摘要：都是一些常用函数，但是可能太常用了，里面的一些关键点，没做过多的研究，今天主要对函数中特殊的地方做出分析1.cvSmooth 图像滤波CV_BLUR_NO_SCALE (简单不带尺度变换的模糊) - 对每个象素的 param1×param2 领域求和。如果邻域大小是变化的，可以事先利用函数 cvIntegral 计算积分图像。 CV_BLUR (simple blur) - 对每个象素param1×param2邻域求和并做尺度变换 1/(param1?param2). CV_GAUSSIAN (gaussian blur) - 对图像进行核大小为 param1× 阅读全文

posted @ 2012-06-06 22:13 RubbyZhang 阅读(2759) 评论(0) 推荐(0) 编辑

Google的相似图片搜索"

摘要：上个月，Google把"相似图片搜索"正式放上了首页。你可以用一张图片，搜索互联网上所有与它相似的图片。点击搜索框中照相机的图标。一个对话框会出现。你输入网片的网址，或者直接上传图片，Google就会找出与其相似的图片。下面这张图片是美国女演员Alyson Hannigan。上传后，Google返回如下结果：类似的"相似图片搜索引擎"还有不少，TinEye甚至可以找出照片的拍摄背景。==========================================================这种技术的原理是什么？计算机怎么知道两张图片相似呢？根据N 阅读全文

posted @ 2012-06-06 02:36 RubbyZhang 阅读(1268) 评论(0) 推荐(0) 编辑

Tesseract3.01在VS2008下面的使用

摘要：通过在Tesseract3+vs2008编译后获得的Tesseract 链接库可以就可以在C语言中调用函数，实现图片的识别，英文字符识别效果还可以，中文的效果就很差了，而且时间很久，具体过程可以参考文章：Tesseract3.01 OCR在VS2008环境下的编译使用（1）本文主要对Tesseract3在C语言中的使用过程进行简单的测试。Tesseract的主要函数成员：初始化函数(1) int Init(const char* datapath, const char* language, char **configs, int configs_size, bool configs_glo. 阅读全文

posted @ 2012-06-06 02:16 RubbyZhang 阅读(4770) 评论(5) 推荐(1) 编辑

opencv（3）矩阵和图像的操作

摘要：1opencv中矩阵和图像可以用相同的函数进行操作，主要包含以下几种类型：大致将每种类型列出表格，对重要的函数进行说明 1：copy add void cvCopy( const CvArr* src, CvArr* dst, const CvArr* mask=NULL ); void cvSe 阅读全文

posted @ 2012-06-04 17:26 RubbyZhang 阅读(873) 评论(0) 推荐(0) 编辑

opencv（2）数据结构

摘要：opencv的基础结构在cxcore文件中，主要结构有： 1.类型的初始化话方法：可以用于多通道矩阵，如果使用的图像是1通道的，则pt.val[0]中存储数据，如果使用的图像是3通道的，则pt.val[0]，pt.val[1]，pt.val[2]中存储数据。 2. CvArr,它只是一个Inte 阅读全文

posted @ 2012-06-04 03:25 RubbyZhang 阅读(934) 评论(0) 推荐(0) 编辑

OPENCV（1）图片，视频读入，输出（highgui）

摘要：1.图像显示 cvnamewindows(); cvshow(); cvwaitkey(); cvdestroywindow() 修改图像显示大小： ResizeWindow( const char* name, int width, int height ); 定义显示窗口位置： void cvM 阅读全文

posted @ 2012-06-04 03:02 RubbyZhang 阅读(895) 评论(0) 推荐(0) 编辑

开源OCR --tesseract

摘要：http://blog.csdn.net/xiaochunyong/article/details/7193744安装一下，使用简单的验证码图像，可以识别到，也就说对于少量的，如果是分隔号的英文，数字，汉子，这个库的识别效果应该还是可以的，如果把它当做一个OCR来检测文本估计效果不好，我看一下博客文章，对其进行测评，确实如此，毕竟是10年前的产品。一些资源：google下载介绍详细介绍:http://www.cnblogs.com/shanyou/archive/2010/10/06/1844551.htmlwindows下面的具体安装使用：http://www.cnblogs.com/bro 阅读全文

posted @ 2012-06-03 22:20 RubbyZhang 阅读(553) 评论(0) 推荐(0) 编辑

tesseract3.01 运行出现can not opencv data file ./tessdata/eng.traineddatade 的问题

摘要：原因很简单，就是没有放进去语言库，tesseract不同版本之间的语言库是不相通的，并且至少有一个语言库，语言库放置在运行exe同一目录的tessdata目录中：可以参考：http://code.google.com/p/tesseract-ocr/wiki/ReadMe 阅读全文

posted @ 2012-06-03 04:46 RubbyZhang 阅读(438) 评论(0) 推荐(0) 编辑

细雨淅淅

Read More, Code More , Learn More --- I just a student~

随笔分类 - 图像处理

公告

最新随笔

我的标签

随笔分类 (186)

阅读排行榜

最新评论