AI质检领域的技术发展概况

工业上的质检领域，是AI的一个重要应用方向，主要是计算机视觉CV的主攻方向。

图1描述了深度学习技术路线的发展简图，AI质检领域主要使用卷积神经网络(CNN)提取工业场景下的视频或图像特征，然后做分类、检测、分割、目标追踪等任务。

图1 深度学习技术发展简图

在工业场景下的分类、检测任务，其数据集特点往往是良率很高，要定位缺陷位置及种类，经常面临缺少缺陷数据的困境，而CV技术发展到目前的YOLOv8阶段，检测技术其实已经非常成熟和稳定，因此工业场景下的视觉任务，基本等价于小样本处理任务，也基本等价于数据增强手段的增加缺陷样本，因为数据的质量，决定了模型性能的上限。

为了提高缺陷样本的数量，业内的尝试大概经历了三个阶段：

1）第一个阶段，对原始缺陷样本随机添加噪声、随机调整亮度/对比度/饱和度等图像参数、随机旋转/裁减图片等手段，人为地增加了一些缺陷样本，这种方式也达到了一定的效果，但其实际增加的缺陷样本数量，还是非常有限的，因此后面有人提出用GAN、VAE加随机噪声的方式。

2）通过GAN、VAE生成式的方式，产生缺陷样本的思路，也达到了一定的效果，但这种方式会产生一定概率的样本失真问题，况且GAN/VAE倾向于生成和原样本“一样”的图片，由于其原理所导致，因此GAN/VAE对增加缺陷样本的效果，也是有限的。

3） Diffusion技术应用阶段，基于Markov链的扩散模型，为创意型图像的生成，以及可控条件下的图像生成等任务，提供了可能，从DDPM发展到LDM，再进一步发展到Stable Diffusion，进入到了CV大模型阶段，为更逼真地生成特定任务下的缺陷样本，提供了技术支持。Diffusion技术结合VAE、UNet、Vit等技术，可结合多模态数据，可控地生成指定风格的图像。

作为深度学习之父们中的LeCun在《Gradient-Based Learning Applied to Document Recognition》中告诉我们，无论什么样的机器学习模型，无外乎图2中的机器学习模型范式，第一步是提取输入数据的特征，俗称特征工程，第二步是训练分类器或回归器，

图2 机器学习模型范式

图3是对图2机器学习模型流程的细化，输入数据需先经过数据预处理阶段，将缺失的值该补充的补充，该统一量纲的统一量纲，该归一化/标准化的，就归一化/标准化，以使输入数据满足模型的要求。然后数据流进入特征工程阶段，通过人为手工挑选、组合原始特征，或模型自己学习如何挑选及组合特征，然后将特征工程的处理结果，输入给模型做训练或推理计算，并得到最终结果。而成像处理，属于特征工程阶段的人为干预产生更利于模型计算的特征。

图3 机器学习数据处理流程

关注更多安卓开发、AI技术、股票分析技术及个股诊断等理财、生活分享等资讯信息，请关注本人公众号(木圭龙的知识小屋)

posted @ 2024-10-30 17:32 tgltt 阅读(409) 评论(0) 收藏举报

刷新页面返回顶部

AI质检领域的技术发展概况

公告