仿射变换是平移、翻转、旋转、缩放、错切这五种变换的组合。
错切变换就是上图中的第5种。
图像的错切实际上是平面景物在投影平面上的非垂直投影。错切使图像中的图形产生扭变,其一般有两种情况:水平方向错切、垂直方向错切。(如下图所示)
具体数学解释,可参考网上的这篇博客:https://blog.csdn.net/ghy_111/article/details/78056441
下面,我们来研究一下错切变换在Halcon中的具体使用方法。
一、水平方向错切——X向错切
代码如下:
1 read_image (Image1, '未标题-1.png')
2 rgb1_to_gray (Image1, Image)
3 threshold (Image, Region, 0, 200)
4 area_center (Image, Area, Row, Column)
5 gen_rectangle2 (Rectangle, Row, Column, 0, 300, 150)
6 intersection (Region, Rectangle, Region)
7 area_center (Region, Area1, Row1, Column1) //求出中间一行字的中心点
8 gen_cross_contour_xld (Cross, Row1, Column1, 16, 0.785)
9
10 *获取字体区域偏转的角度
11 text_line_slant (Region, Image, 85, -0.723599, 0.723599, SlantAngle) //85是字符的像素高度
12
13 *生成矩阵初始化
14 hom_mat2d_identity (HomMat2DIdentity)
15
16 *SlantAngle是之前获取的字体斜了多少度,那么要转正的话就要纠正这个偏转角度,所以就要向相反方向偏正
17 hom_mat2d_slant (HomMat2DIdentity, -SlantAngle, 'x', Row1, Column1, HomMat2DSlant)
18 affine_trans_image (Image1, ImageAffinTrans, HomMat2DSlant, 'constant', 'false')
输出的ImageAffinTrans图如下:(可见图中文字已被转正)
二、垂直方向错切——Y向错切
代码如下:
1 read_image (Image2, '未标题-2.png')
2 rgb1_to_gray (Image2, Image)
3 threshold (Image, Region, 0, 200)
4 area_center (Image, Area, Row, Column)
5 gen_rectangle2 (Rectangle, Row, Column, 0, 300, 150)
6 intersection (Region, Rectangle, Region)
7 area_center (Region, Area1, Row1, Column1)
8 gen_cross_contour_xld (Cross, Row1, Column1, 16, 0.785)
9
10 *获取字体区域偏转的角度(Y向错切,这行算子貌似不可用)
11 * text_line_slant (Region, Image, 85, -0.723599, 0.723599, SlantAngle)
12
13 *生成矩阵初始化
14 hom_mat2d_identity (HomMat2DIdentity)
15
16 *SlantAngle是之前获取的字体斜了多少度,那么要转正的话就要纠正这个偏转角度,所以就要向相反方向偏正
17 hom_mat2d_slant (HomMat2DIdentity, 0.18, 'y', Row1, Column1, HomMat2DSlant)
18 affine_trans_image (Image2, ImageAffinTrans, HomMat2DSlant, 'constant', 'false')
输出的ImageAffinTrans图如下:(可见图中文字已被转正)
三、原图尝试水平方向+垂直方向错切
代码如下:
1 read_image (Image3, '未标题-3.png')
2 rgb1_to_gray (Image3, Image)
3 threshold (Image, Region, 0, 200)
4 area_center (Image, Area, Row, Column)
5 gen_rectangle2 (Rectangle, Row, Column, 0, 300, 150)
6 intersection (Region, Rectangle, Region)
7 area_center (Region, Area1, Row1, Column1)
8 gen_cross_contour_xld (Cross, Row1, Column1, 16, 0.785)
9
10 * 生成矩阵初始化
11 hom_mat2d_identity (HomMat2DIdentity)
12 hom_mat2d_slant (HomMat2DIdentity, 0.3, 'x', Row1, Column1, HomMat2DSlant)
13 * 临时观察旋转图结果
14 affine_trans_image (Image, ImageTemp, HomMat2DSlant, 'constant', 'false')
15 hom_mat2d_slant (HomMat2DSlant, -0.4, 'y', Row1, Column1, HomMat2DSlant2)
16 affine_trans_image (Image3, ImageAffinTrans, HomMat2DSlant2, 'constant', 'false')
17
18 * 尝试通过反错切,看能否仿射回来(×)
19 hom_mat2d_identity (Hom)
20 hom_mat2d_slant (Hom, 0.4, 'y', Row1, Column1, HomSlant)
21 hom_mat2d_slant (HomSlant, -0.3, 'x', Row1, Column1, HomSlant2)
22 affine_trans_image (ImageAffinTrans, ImageBack, HomSlant2, 'constant', 'false')
23
24 * 通过逆矩阵仿射试试(√)
25 hom_mat2d_invert (HomMat2DSlant2, HomMat2DInvert)
26 affine_trans_image (ImageAffinTrans, ImageBack2, HomMat2DInvert, 'constant', 'false')
输出的ImageBack图如下:(与原图中的字有一定出入,具体应该怎么正确构造这个反向仿射矩阵,我还不是很清楚)
输出的ImageBack2图如下:(与原图中的字完全一致)
四、总结
① 算子text_line_slant 能获得一行文字的水平错切角度。
② 水平错切、垂直错切,均可以通过仿射变换校正。
③ 只要能找到正确的逆矩阵,就可以将多次错切变换后的图形仿射回原始形状。
④ 当text_line_slant算子无法起作用时,也可以通过拟合外轮廓,拟合直线求倾斜角的方式得到错切角度。(具体本文略去)
⑤ 错切变换经常用于“斜体文字”的OCR识别。下图中可先将斜体字转成正体字,然后分割字符,再进行OCR识别。
--------------------------------------------
本文系原创,转载请注明出处。
如果文章对您有帮助,可以点击下方的【好文要顶】或【关注我】;如果您想进一步表示感谢,可通过网页右侧的【打赏】功能进行打赏。
感谢您的支持,我会继续写出更多的相关文章!文章有不理解的地方欢迎跟帖交流,博主经常在线!^_^