一杯清酒邀明月
天下本无事,庸人扰之而烦耳。
posts - 3121,comments - 209,views - 578万

HOG(Histogram of Oriented Gradient)方向梯度直方图,主要用来提取图像特征,最常用的是结合svm进行行人检测。

算法流程图如下(这篇论文上的):

下面我再结合自己的程序,表述一遍吧:

1.对原图像gamma校正,img=sqrt(img);

2.求图像竖直边缘,水平边缘,边缘强度,边缘斜率。

3.将图像每16*16(取其他也可以)个像素分到一个cell中。对于256*256的lena来说,就分成了16*16个cell了。

4.对于每个cell求其梯度方向直方图。通常取9(取其他也可以)个方向(特征),也就是每360/9=40度分到一个方向,方向大小按像素边缘强度加权。最后归一化直方图。

5.每2*2(取其他也可以)个cell合成一个block,所以这里就有(16-1)*(16-1)=225个block。

6.所以每个block中都有2*2*9个特征,一共有225个block,所以总的特征有225*36个。

当然一般HOG特征都不是对整幅图像取的,而是对图像中的一个滑动窗口取的。

lena图:

求得的225*36个特征:

matlab代码如下:

复制代码
 1 clear all; close all; clc;
 2 
 3 img=double(imread('lena.jpg'));
 4 imshow(img,[]);
 5 [m n]=size(img);
 6 
 7 img=sqrt(img);      %伽马校正
 8 
 9 %下面是求边缘
10 fy=[-1 0 1];        %定义竖直模板
11 fx=fy';             %定义水平模板
12 Iy=imfilter(img,fy,'replicate');    %竖直边缘
13 Ix=imfilter(img,fx,'replicate');    %水平边缘
14 Ied=sqrt(Ix.^2+Iy.^2);              %边缘强度
15 Iphase=Iy./Ix;              %边缘斜率,有些为inf,-inf,nan,其中nan需要再处理一下
16 
17 
18 %下面是求cell
19 step=16;                %step*step个像素作为一个单元
20 orient=9;               %方向直方图的方向个数
21 jiao=360/orient;        %每个方向包含的角度数
22 Cell=cell(1,1);              %所有的角度直方图,cell是可以动态增加的,所以先设了一个
23 ii=1;                      
24 jj=1;
25 for i=1:step:m          %如果处理的m/step不是整数,最好是i=1:step:m-step
26     ii=1;
27     for j=1:step:n      %注释同上
28         tmpx=Ix(i:i+step-1,j:j+step-1);
29         tmped=Ied(i:i+step-1,j:j+step-1);
30         tmped=tmped/sum(sum(tmped));        %局部边缘强度归一化
31         tmpphase=Iphase(i:i+step-1,j:j+step-1);
32         Hist=zeros(1,orient);               %当前step*step像素块统计角度直方图,就是cell
33         for p=1:step
34             for q=1:step
35                 if isnan(tmpphase(p,q))==1  %0/0会得到nan,如果像素是nan,重设为0
36                     tmpphase(p,q)=0;
37                 end
38                 ang=atan(tmpphase(p,q));    %atan求的是[-90 90]度之间
39                 ang=mod(ang*180/pi,360);    %全部变正,-90变270
40                 if tmpx(p,q)<0              %根据x方向确定真正的角度
41                     if ang<90               %如果是第一象限
42                         ang=ang+180;        %移到第三象限
43                     end
44                     if ang>270              %如果是第四象限
45                         ang=ang-180;        %移到第二象限
46                     end
47                 end
48                 ang=ang+0.0000001;          %防止ang为0
49                 Hist(ceil(ang/jiao))=Hist(ceil(ang/jiao))+tmped(p,q);   %ceil向上取整,使用边缘强度加权
50             end
51         end
52         Hist=Hist/sum(Hist);    %方向直方图归一化
53         Cell{ii,jj}=Hist;       %放入Cell中
54         ii=ii+1;                %针对Cell的y坐标循环变量
55     end
56     jj=jj+1;                    %针对Cell的x坐标循环变量
57 end
58 
59 %下面是求feature,2*2个cell合成一个block,没有显式的求block
60 [m n]=size(Cell);
61 feature=cell(1,(m-1)*(n-1));
62 for i=1:m-1
63    for j=1:n-1           
64         f=[];
65         f=[f Cell{i,j}(:)' Cell{i,j+1}(:)' Cell{i+1,j}(:)' Cell{i+1,j+1}(:)'];
66         feature{(i-1)*(n-1)+j}=f;
67    end
68 end
69 
70 %到此结束,feature即为所求
71 %下面是为了显示而写的
72 l=length(feature);
73 f=[];
74 for i=1:l
75     f=[f;feature{i}(:)'];  
76 end 
77 figure
78 mesh(f)
复制代码

 

posted on   一杯清酒邀明月  阅读(732)  评论(0编辑  收藏  举报
编辑推荐:
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
阅读排行:
· 全网最简单!3分钟用满血DeepSeek R1开发一款AI智能客服,零代码轻松接入微信、公众号、小程
· .NET 10 首个预览版发布,跨平台开发与性能全面提升
· 《HelloGitHub》第 107 期
· 全程使用 AI 从 0 到 1 写了个小工具
· 从文本到图像:SSE 如何助力 AI 内容实时呈现?(Typescript篇)
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示