随笔分类 - 图像处理
摘要:直线、平面 在说超平面之前,先说说 Rn 空间中的直线和平面。给定 Rn 空间中的一点 p 和一非负向量 v⃗ ,满足 i=tv⃗ +p 的点 i 的集合称为 Rn 空间中的一条直线。上式中 t 是一个标量,向量 v⃗ 决定了该直线的方向。如图1所示: 图1:line figure illustra
阅读全文
摘要:原文地址:[ZZ]计算机视觉、机器学习相关领域论文和源代码大集合作者:计算机视觉与模式 注:下面有project网站的大部分都有paper和相应的code。Code一般是C/C++或者Matlab代码。 最近一次更新:2013-1-29 一、 特征提取Feature Extraction: SIFT [1] [Demo program][SIFT Library] [VLFeat] PCA-...
阅读全文
摘要:(1)pattern recognition letters, 从投稿到发表,一年半时间 (2)Pattern recognition 不好中,时间长 (3)IEICE Transactions on Information and Systems, 作者中有一个必须是会员。收费高,审稿快。影响因子0.4 (4)International Journal of Pattern Recognitio...
阅读全文
摘要:codebook采用量化技术从时间序列中获得背景模型,能够检测像素剧烈变化、或者有移动物体或者更为复杂的背景模型。codebook为每个像素建立一个codebook,每个codebook含有一个或者多个codeword,codeword 记录背景学习的阈值、对应像素的更新时间以及访问频率等,通过这些
阅读全文
摘要:直方图反向投影式通过给定的直方图信息,在图像找到相应的像素分布区域,opencv提供两种算法,一个是基于像素的,一个是基于块的。使用方法不写了,可以参考一下几个网站:直方图反向投影参考1直方图参考2测试例子1:灰度直方图反向投影灰度直方图反向投影IplImage * image= cvLoadImage("22.jpg"); IplImage * image2= cvLoadImage("2.jpg"); int hist_size=256; float range[] = {0,255}; float* ranges[]={range}; IplIma
阅读全文
摘要:1.sobel算子sobel算子利用多项式计算导数的近似值,其计算公式和3*3模版如下,sobel算子结合了一些滤波的效果,对噪声有一定的鲁棒性。 opencv提供了进行sobel算子的函数,函数如下:void cvSobel( const CvArr* src, CvArr* dst, int xorder, int yorder, int aperture_size=3 );src :输入图像. 单通道,8位或者浮点dst: 输出图像. 单通道,如果是8位图像,为了防止溢出,输出必须是IPL_DEPTH_16S类型xorder: x 方向上的差分阶数 yorder : y 方向上的差分阶数
阅读全文
摘要:1 直方图均衡化 测试1 直方图均衡化 测试图像: 2 .直方图对比 对比的的方法用method表示,主要由以下几种办法: CV_COMP_CORREL 相关方法:完全匹配为1,完全不匹配为-1,0是无关联 CV_COMP_CHISQR 卡尔:完全匹配是0 ,完全不匹配为无限值 CV_COMP_IN
阅读全文
摘要:opencv中的直方图弄的一点小复杂,看了好几天还是有点不明白,尤其是后面涉及多维直方图的时候,算了还是一步一步的重新看一下吧。 一 直方图基本操作 1 CvHistogram int dims = 2 ; int h_bins = 8, s_bins = 8; int hist_size[] =
阅读全文
摘要:图像金字塔是图像中多尺度表达的一种,也是很常见的,最主要用于图像的分割。opencv中给出了图像金字塔的一些列函数,再谈openv之前先介绍下高斯金字塔和拉普拉斯金字塔 1 高斯金字塔和拉普拉斯金字塔 (1)高斯金字塔是通过高斯平滑和亚采样获得一些列下采样图像,也就是说第K层高斯金字塔通过平滑、亚采
阅读全文
摘要:图像形态学一般用于阈值化后的二值图像,其实也可以用于灰度图像的处理,这篇文章主要对灰度中的应用做分析。1.膨胀与腐蚀函数void cvErode( const CvArr* src, CvArr* dst, IplConvKernel* element=NULL, int iterations=1 );//腐蚀函数void cvDilate( const CvArr* src, CvArr* dst, IplConvKernel* element=NULL, int iterations=1 );//膨胀函数函数解释可以参考:opencv论坛,关于里面的结构IplConvKernel可以参考:
阅读全文
摘要:都是一些常用函数,但是可能太常用了,里面的一些关键点,没做过多的研究,今天主要对函数中特殊的地方做出分析1.cvSmooth 图像滤波CV_BLUR_NO_SCALE (简单不带尺度变换的模糊) - 对每个象素的 param1×param2 领域求和。如果邻域大小是变化的,可以事先利用函数 cvIntegral 计算积分图像。 CV_BLUR (simple blur) - 对每个象素param1×param2邻域 求和并做尺度变换 1/(param1?param2). CV_GAUSSIAN (gaussian blur) - 对图像进行核大小为 param1×
阅读全文
摘要:上个月,Google把"相似图片搜索"正式放上了首页。你可以用一张图片,搜索互联网上所有与它相似的图片。点击搜索框中照相机的图标。一个对话框会出现。你输入网片的网址,或者直接上传图片,Google就会找出与其相似的图片。下面这张图片是美国女演员Alyson Hannigan。上传后,Google返回如下结果:类似的"相似图片搜索引擎"还有不少,TinEye甚至可以找出照片的拍摄背景。==========================================================这种技术的原理是什么?计算机怎么知道两张图片相似呢?根据N
阅读全文
摘要:通过在Tesseract3+vs2008编译后获得的Tesseract 链接库可以就可以在C语言中调用函数,实现图片的识别,英文字符识别效果还可以,中文的效果就很差了,而且时间很久,具体过程可以参考文章:Tesseract3.01 OCR在VS2008环境下的编译使用(1)本文主要对Tesseract3在C语言中的使用过程进行简单的测试。Tesseract的主要函数成员:初始化函数(1) int Init(const char* datapath, const char* language, char **configs, int configs_size, bool configs_glo.
阅读全文
摘要:1opencv中矩阵和图像可以用相同的函数进行操作,主要包含以下几种类型: 大致将每种类型列出表格,对重要的函数进行说明 1:copy add void cvCopy( const CvArr* src, CvArr* dst, const CvArr* mask=NULL ); void cvSe
阅读全文
摘要:opencv的基础结构在cxcore文件中,主要结构有: 1.类型的初始化话方法: 可以用于多通道矩阵,如果使用的图像是1通道的,则pt.val[0]中存储数据 ,如果使用的图像是3通道的,则pt.val[0],pt.val[1],pt.val[2]中存储数据。 2. CvArr,它只是一个Inte
阅读全文
摘要:1.图像显示 cvnamewindows(); cvshow(); cvwaitkey(); cvdestroywindow() 修改图像显示大小: ResizeWindow( const char* name, int width, int height ); 定义显示窗口位置: void cvM
阅读全文
摘要:http://blog.csdn.net/xiaochunyong/article/details/7193744安装一下,使用简单的验证码图像,可以识别到,也就说对于少量的,如果是分隔号的英文,数字,汉子,这个库的识别效果应该还是可以的,如果把它当做一个OCR来检测文本估计效果不好,我看一下博客文章,对其进行测评,确实如此,毕竟是10年前的产品。一些资源:google下载介绍详细介绍:http://www.cnblogs.com/shanyou/archive/2010/10/06/1844551.htmlwindows下面的具体安装使用:http://www.cnblogs.com/bro
阅读全文
摘要:原因很简单,就是没有放进去语言库,tesseract不同版本之间的语言库是不相通的,并且至少有一个语言库,语言库放置在运行exe同一目录的tessdata目录中:可以参考:http://code.google.com/p/tesseract-ocr/wiki/ReadMe
阅读全文