图像识别的一些基础
以上是四副正射影像图,提取好边线,对于每个角点,能自动匹配标记好号码1~n;
*在距离物体的距离,大于物体的2.5倍,那么,就可以忽略物体的透视,认为得到物体的影像是正射影像;
已知ABC是同一物体的正射影像,而U是同类物体,但不一定是同一物体的正射影像。
对于各个点,有:
XU1 = aXA1 + bXB1 + cXC1 + d
XU2 = aXA2 + bXB2 + cXC2 + d
XU3 = aXA3 + bXB3 + cXC3 + d
XU4 = aXA4 + bXB4 + cXC4 + d
*想在一下,只有旋转没有平移的平面旋转 Xt = A Xs ,A是2*2的矩阵,Xt是XY
以上可以化为矩阵的形式,解出a,b,c,d;
XU1 XA1 XB1 XC1 1 a
XU2 = XA2 XB2 XC2 1 b
XU3 XA3 XB3 XC3 1 c
XU4 XA4 XB4 XC4 1 d
那么,可以预测U5,如果U5预测的位置和标记出的位置不相同,那就有理由相信,U5和ABC中的物体,不是同一个物体;
另一种识别的办法,就是用信号的原理,求积分:
对于信号函数,假如f(x)g(x)在X0处同号,那就取得很大的值如果有:
∫F(x)g1(x)dx,∫F(x)g2(x)dx……
取得最大只者,F(x)和g(x)最相似;
假如人脸的图像,都规定缩放在一个特定的尺寸,而且先进行二值化处理;
然后逐个像素两两相乘,得出最大者;
或者对两幅图像建模,灰度函数也可:
∫D f(x,y)g(x,y)dxdy
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现
2018-01-28 学习笔记67_决策树