[论文总结] 深度学习技术在植物领域的研究2
文章目录
- 1. A Review on Deep Learning for Plant Species Classification using Leaf Vein (IF=15.2,2020)
- 2.The Smart Image Recognition Mechanism for Crop Harvesting System in Intelligent Agriculture (IF=3.073,2020)
- 3. Deep Convolutional Neural Networks for Fruit Tree Classification and Spatial Analysis Using Aerial Imagery (An ASABE Meeting Presentation,2020)
- 4. Image Processing Techniques for Detecting and Classification of Plant Disease – A Review (会议论文,2019)
- 5. Anthracnose disease diagnosis by image processing, support vector machine and correlation with pigments (IF=1.15,2019)
- 6. Deep learning – Method overview and review of use for fruit detection and yield estimation (IF=3.998,2019)
- 7. DeepWeeds: A Multiclass Weed Species Image Dataset for Deep Learning (IF=3.998, 2019)
- 8. Artificial cognition for applications in smart agriculture: A comprehensive review(IF=6.628, 2020)
- 9. Image-based classification of plant genus and family for trained and untrained plant species (IF=2.511, 2019)
- *10. Current and future applications of statistical machine learning algorithms for agricultural machine vision systems (IF=3.998, 2019)
- 11. A Mobile Application for Tree Classification and Canopy Calculation using Machine Learning (会议论文,2019)
1. A Review on Deep Learning for Plant Species Classification using Leaf Vein (IF=15.2,2020)
许多的深度学习技术应用于植物叶子识别。大部分的研究工作是基于CNN、GLCM、朴素贝叶斯分类器、RBF神经网络、PNN、MLP和zernike矩实现。
人们提出了一种称为CapsNet的新方法, 将有助于区别植物叶脉进行分类。 所提出的方法包括提取叶脉的四个主要步骤-照片采样,照片预处理(RGB到灰度转换,sobel区域检测,骨架化),CapsNet技术的特征提取和PNN方法的特征类型。通过CapsNet技术利用叶脉模式进行了植物叶片识别。
2.The Smart Image Recognition Mechanism for Crop Harvesting System in Intelligent Agriculture (IF=3.073,2020)
2.1 研究目的
通过使用神经网络训练的智能识别模型,然后系统再确认作物是否可以收获,最后使用机械臂收割作物。
2.2 系统模型
研究可以分为三个部分,即目标检测、手臂控制和通信系统。
目标检测系统主要负责图像检测,并将检测结果发送到手臂控制系统进行手臂运动预测。最后,通信系统将图像信息发送到目标检测模型进行检测并实现机器手臂控制。
精度检测使用TensorFlow构建的MobileNet SSD CNN模型进行目标检测,主要通过调整训练图像和批量训练不同数量的图像来获得系统容忍度,以测试模型网络的检测精度。
手臂控制包括硬件的组装。硬件采用树莓派,负责图像流媒体和接收网页命令;机械臂,由六个伺服马达组成;网络摄像头;一个GPS模块;超声波传感模块;以及携带各种物品的履带式移动车辆。
2.3 目标检测模型
对象检测模型多种类型的目标检测神经网络模型目前存在。然而,本研究需要一个系统兼具检测精度和检测速度。通过参考各种对象的结果检测神经网络模型,本研究最终选定,一个基础CNN架构与低并系统与bbox的SSD配对容纳各种大小对象的算法。通常,在训练过程中会收集不同的训练数据集通过机器训练,避免得到过拟合的模型这样得到的结果出现假阳性。
因此,本研究对目标类型、图像捕捉角度、打开摄像机距离、环境照明和环境复杂性增加了神经网络的模型的理解。图像是通过模拟农田的设置,从而提高模型的准确性。另外,图像的大小和分辨率也受到了影响,统一用智能手机拍摄训练数据。
数据分为两类,即成熟番茄和不成熟番茄。这个系统决定了一个水果是否成熟可以收割了。两种尺寸的训练图像以测试训练图像大小对模型的影响准确性。目前的研究以农作物为检测对象,并对其进行期望以不同的大小被检测到。本研究共准备了890张训练图像以1:9的比例随机分布在主数据集中491张来自网上,399张是农田中抓获。
2.4 结论
这项研究使用了具有IoT技术的对象检测算法来开发远程农作物收割系统。提议的对象检测模型是MobileNet SSD模型。其平均准确度为84%,高于其他模型。还设计了使用四层感知器模型的手臂运动预测模型;平均采摘精度达到89%。
[个人总结] 论文主要通过数据收集,信息交流通讯,以及机器人采摘3个部分来展开研究。但从实际应用而言,通过机器臂采摘果实相比人力速度慢,相比机器去摇树收获果树更费时,实际应用空间不大。
3. Deep Convolutional Neural Networks for Fruit Tree Classification and Spatial Analysis Using Aerial Imagery (An ASABE Meeting Presentation,2020)
应用了AlexNet和VGGNet之类的高级DCNN模型来识别视觉模式并提取图像特征,从而提高了果树分类的性能。使用这些修改后的DCNN模型,我们可以在航拍照片上轻松识别出果树,如蜡苹果,枣,柑桔或荔枝树。我们还应用了对象检测技术来近似不同作物类型的边界框并估计其耕种面积。
3.1 方法
3.1.1 处理过程
-
树木的数据处理分为两个类别,预处理和分类。预处理是去除耕地和云等干扰条件。分类是将检测到的果树的种类进行区分。
-
通过航拍图片将土地话分为小地块,然后再进行分割。以地瓜、大枣、荔枝等果树为训练集。监督学习需要大量的标记数据集,在地理信息系统(GIS)上分别对不同种类的果树在航拍照片上进行标记,将标记好的地块映射成多个多边形,然后将这些多边形导出到一个形状文件中。利用标记后的形状文件,在GIS辅助下从航拍图像中截取某一种果树。将GIS工具转换成python代码,并在不手动重复相同过程的情况下完成所有分离操作。
-
进行数据的筛选。如不同果树在不同季节的形态会变化。下一步统一输入图片的大小。有两种常用的方法来统一图像的大小。首先,up-sampling或向下采样将所有图像调整为指定的大小。其次,修剪一定大小的地块。然而,第一种方法会导致分辨率的丧失,从而模糊物体的特征。果树的一些特征可能消失。我们更关心的是树木的种植安排,而不是每个地块的形状。农田的图案和纹理比形状重要得多。因此,第二种方法对于我们的研究似乎是一个更好的选择。
-
数据增加
在我们的训练数据集中有7584张图像。使用数据增强来扩大数据集。我们应用旋转、放大、放大、翻转和拉伸原始数据,创建更多数据集,解决数据不足问题。
3.1.2 卷积神经网络
- 修改后的AlexNet
- 修改后的VGG16
3.1.3 调整学习效率
3.1.4 删除不清楚的模块和图片
3.1.5 区分白色的网
比如有些枣树会覆盖白色的网,从薄薄的白网里,我们还能辨认出枣树的图案。然而,假如覆盖的是一张厚厚的白色网,我们只能得到网的颜色,而看不到任何树的图案。在模型的改进中,应多采用不同网眼厚度的枣园地块的辨别。
3.1.6 区分黑色的网
一些蜡苹果树被黑色的网覆盖以保护果实。“无遮盖的苹果蜡”和“有遮盖的苹果蜡”“苹果”通常被标在一块土地上。改进了标记工作,以区分这两种类型图案分离,使“黑网覆蜡苹果”成为一个独立的类型。
3.2 结论
修改后的AlexNet和VGG16模型可以成功地将航拍图像分类为蜡苹果,枣,荔枝和柑桔果树。 使用这些分类器模型,我们可以更有效地分析航拍照片中的果树分布。 如果可以更彻底地实现原始航拍图像的色彩校正和地块的数据选择,则DCNN模型将具有更好的性能。
4. Image Processing Techniques for Detecting and Classification of Plant Disease – A Review (会议论文,2019)
4.1 摘要
本文通过检查用于检测植物叶子或果实上疾病的技术以及用于分类疾病的机器学习模型,对图像处理领域的当前研究进行了概述。本文的主要目的是展示当前的技术水平,并阐明在图像处理阶段所采取的步骤,并检查所用每种技术的优缺点,以及用于分类疾病的机器学习模型的性能。
4.2 目前应用在检测叶片、果实上虫害的深度学习方法
(下表列出的期刊中大多都不错,影响因子3-5分)
5. Anthracnose disease diagnosis by image processing, support vector machine and correlation with pigments (IF=1.15,2019)
基于MATLAB,通过从DSLR摄像机捕获图像来分析疾病严重程度。通过预处理提高了图像的质量,并使用灰度共生矩阵(GLCM)获得了图像的纹理特征。通过支持向量机(SVM)将图像分类为健康或感染(炭疽病)。还估计了真菌感染对色素的影响,包括总叶绿素和类胡萝卜素含量,并与计算数据相关。
6. Deep learning – Method overview and review of use for fruit detection and yield estimation (IF=3.998,2019)
6.1 摘要
重点介绍了深度学习模型在水果检测和定位任务中的实际应用,以支持树木作物负荷估计。对果树影像计数外推到产量估计中的方法进行了综述,以解决影像中果实遮挡的问题。
6.2 介绍
1 应用深度学习
对象检测框架包括Faster R-CNN、SSD和YOLO,检测器包括Oxford Visual Geometry Group Network (VGGNet) (Simonyan and Zisserman, 2014)、残值网络(ResNet) (He et al., 2016)、Zeiler and Fergus Network (ZFNet) (Zeiler and Fergus, 2014)。重点放在实际方面,需要考虑时,采用标准的深度学习模型的水果检测任务。提出了对文献作出原创性贡献所需的建议,而不是将已建立的方法公式化地应用于新的应用领域(例如,一种新的商品),包括使用涉及的模型比较的标准度量标准二进制分类。
2. 公共数据集
目前很多公共数据集都得到了更多的利用但缺乏果园的公共数据集体。
3. 许多已发表的工作集中在提高算法的准确性,以准确预测树冠图像中的果实数量。但是较少的工作将图像水果的数量与果园块的实际产量相关。
6.3 CNN 和深度学习-背景
精度的提高通常与模型深度的增加有关,该模型深度是通过使用图层之间的连接进行调节的。但是,训练和测试误差会随着深度的增加而增加,使得更深层的模型难以训练。
目前深度学习应用模型主要有:
- ZFNet使用类似于AlexNet的体系结构,但具有更多的较小尺寸的卷积过滤器。较小的过滤器大小可以捕获在图像中更局部分布的信息,这可以导致更准确的分类/检测结果。
- VGGNet使用了更小的过滤器大小和更多的卷积层(16-19层),但是巨大的内存需求使其在计算上变得昂贵。使用更多的层(更深的模型)会牺牲计算速度以提高准确性。
- GoogLeNet
- ResNet使用了具有“身份快捷方式连接”功能的残留块,该残留块使信息能够在深层网络中流动而不会丢失(“消失梯度”问题)。
- 门控双向网络(GBDNet)
- Region-CNN(R-CNN)在Fast R-CNN(Girshick,2015年)中,SPP层被固定大小的兴趣池(ROIPooling)层取代,从而实现了比R-CNN更快的速度。 2015年,Faster R-CNN以区域提案网络取代了Fast R-CNN中的选择性搜索.
- Mask-RCNN作为对Faster RCNN的扩展
- YOLO,YOLOv2, YOLOv3
6.4 目标图像检测
6.4.1 框架步骤
包括图像预处理、得分假设、解决检测(删除得分较低的假设)等步骤。
6.4.2 特征提取
- Circular Hough Transform (CHT)
- Random Hough Transform (RHT)
- HOG (Dalal and Triggs, 2005), LBP (Ojala et al.,1996), Scale-Invariant Feature
6.4.3 CNN作为特征提取器
- YOLOv2模型
- CNN在卷积层中开发过滤器
目标检测框架使用CNN特征提取器进行分类任务,使用盒回归进行目标定位。例如,已在RCNN和Overfeat中实现AlexNet,在SPPNet中使用ZFNet,在Fast R-CNN,Vaster R-CNN和SSD中使用VGG-16,在YOLOv2中使用Darknet-19,并使用Darknet-53在YOLOv3中。然而,根据应用,特征提取器可以互换使用。例如,ZFNet可以在Faster R-CNN框架中使用。
6.4.4 深度学习对象检测框架
- CNN滑动窗口检测器
早期基于CNN的对象检测框架,如Overfeat使用. - 两极检测
- Fast R-CNN是为了提高RCNN的检测速度而开发的。
- Faster R-CNN用区域提议网络(RPN)代替了Fast R-CNN的启发式选择性搜索方法,该提议使用CNN和锚点盒来提高速度。
- 一级检测(单炮检波器)
- 单发MultiBox检测器Single Shot MultiBox Detector(SSD)同时预测图像上的对象类和边界框使其比Faster R-CNN更快。
- YOLO,YOLOv2, YOLOv3
6.4.5 网络和模型训练
- 训练模型和测试要求
- 训练图像数
训练深度学习模型所需的最小图像数量取决于用于目标检测的图像的视觉复杂性和用于学习的深度学习模型。如:通过捕获测试集中变化的最小数量训练图像进行评估,针对使用从训练集中采样的越来越多的图像开发的模型计算AP。
6.5 总结
通过自动学习,在人工神经网络中不再需要手工制作特征和设计特征描述符。通常,ANN模型的精度会随着模型层数的增加而提高,但代价是计算复杂性增加。在对更高速度的需求的选择性压力下,目标检测框架已经发展起来,从基于两级区域的检测器发展到单发密集目标检测器。据报道,深度学习模型优于传统的像素分割技术 机器学习和CNN和神经网络来完成植物上水果的检测任务。具有预先训练的权重的公开可用检测框架以及用于注释的大型公共带注释图像数据集的可用性使得采用深度学习相对容易。通常,通过使用数百个训练图像,可以对模型进行微调,以用于特定的图像对象检测任务。应创建树上(和其他农业应用)水果的带注释图像的公共数据集,以使用相同的图像训练,验证和测试集促进算法比较。
在这篇综述中,机器视觉的背景下讨论了深度学习,但是这项技术与其他数据类型相关。深度学习方法来自动从多维的原始数据中提取有用的信息(例如,数字图像,激光雷达数据、多光谱、遥感和卫星数据、天气、气候和环境数据来自多个传感器)及其与大数据的可伸缩性等为应用程序带来了实时产量估计和预测,作物生长模型和植物疾病和害虫的造型。应用开发将依赖于包括一系列环境条件、品种和作物类型和模式(传感器和数据类型)的数据质量。
7. DeepWeeds: A Multiclass Weed Species Image Dataset for Deep Learning (IF=3.998, 2019)
这项工作介绍了第一个大型的多类杂草物种图像数据集,该数据集完全从澳大利亚牧场原地采集。 DeepWeeds包含八种对澳大利亚具有国家重要意义的杂草,并且分布在澳大利亚北部的八个地理位置。我们使用Inception-v3和ResNet-50 CNN模型在数据集上表现出很强的基准性能,它们的平均分类性能达到95.1% 和95.7%。在目标杂草控制应用程序的实时要求下,性能最佳的ResNet-50模型的推理效果也很好,每幅图像的推理速度为53.4毫秒,每秒图像的推理速度为18.7 fps。这些强大的分类结果进一步证明了深度学习对于高度可变的图像数据集的强大功能,并表明实时部署此类复杂模型是可行的。我们预计,该数据集和分类结果将激发对现实条件下牧场杂草分类的进一步研究。该领域的未来工作包括:提高对DeepWeeds数据集进行分类的准确性和鲁棒性,将我们的学习模型作为杂草控制机器人原型的检测系统进行现场实施,并研究将NIR光谱学和高光谱成像技术用于杂草物种分类。收集包括牧场环境的现实生活复杂性在内的数据集所花的时间太长,应该可以实现出色的现场性能。
8. Artificial cognition for applications in smart agriculture: A comprehensive review(IF=6.628, 2020)
本文的目的是回顾农业智能的各种应用,例如精准农业,疾病检测,机器学习,深度学习,图像处理,人工神经网络,深度学习,卷积神经网络,无线传感器网络(WSN)技术,无线通信,机器人技术,物联网(IoT) ,不同的遗传算法,模糊逻辑和计算机视觉等。
8.1 精准农业
精准耕种与“正确的地点,正确的时间和正确的产品”有关。精确耕种比传统耕种更精确,可控制的技术取代了重复性劳动密集型农业。数据收集,数据分析,管理决策和耕种是精确耕种的四个主要阶段。
目前精准农业的技术应用有GPS / GNSS,移动设备,机器人,无人驾驶拖拉机,灌溉,无人飞行器(UAV),物联网(IoT),传感器,可变速率播种,天气建模等。也有基于人工智能的新技术,例如人工神经网络(ANN)和模糊逻辑控制器,用于调节温室的温度和湿度。
分类过程对于精确耕作过程也至关重要。野口等在田间作业中使用通用算法(GA)优化的模糊逻辑对农作物进行分类。人工神经网络也应用于估算大豆的高度和宽度。
同样,神经网络和模糊逻辑在进行农作物分类时很有用。这样的过程包括图像捕获或输入信息,特征提取,然后分类和/或分级(Naganur等,2012)。基于尺寸,形状等参数(Mustafa等,2009),颜色,香气等。作物的最终分级按1-10的范围进行。同样,也可以根据日期树可能提供的条件和产量进行分级,以帮助农民正确利用其资源(Mazloumzadeh等,2009)。
自主移动机器人也应用于精确农业中完成各种不同任务。自主机器人具有适应能力和学习能力。大多数自主机器人都有用于输入信息的传感器,然后由控制单元进行处理。机器人控制系统可以基于模糊逻辑(Hagras等,2000)。机器人可以通过内置的抓爪系统和手眼系统来检查和处理植物。(Acaccia等人,2003)。其他广泛使用的机器人应用包括除草(Slaughter等,2008)。它基于机器视觉系统,并包括精密化学应用系统。这似乎在很大程度上是有益的,因为控制杂草是一项极其繁琐且效率低下的任务,会增加人工劳动。除此之外,机器人还用于作物表型评估植物的健康状况。尽管不同的机器人使用了不同的导航系统,但它们通常在GPS与人类操作的笔记本电脑组合时在两行植物之间移动时受到引导。
8.2 植物病害检测
主要应用的算法有深度卷积神经网络(Ferentinos,2018)在识别相应的疾病和植物方面达到了99.53%的成功率。神经网络也已经用于检测水稻等农作物中的疾病(Phadikar和Sil,2008年)。K-均值算法(Mehra等,2016),主成分分析(PCA),变异系数(CV)(Schor等,2016),支持向量机(SVM)(Bhange and Hingoliwala,2015)也是其他替代方法,在某些情况下还可以提供更有效的模型基础。在一个示例研究中,将K均值聚类以将其分为两类:健康的和感染的,结果是支持向量机(SVM),比ANN提供了更好的结果。(Omrani等,2014)。
Bashir和Sharma(2012)使用颜色和质地来识别和分类不同的农业/园艺,其结合特征证明是检测植物病害的有效方法。使用K-mean聚类等方法,将贝叶斯分类器的颜色和纹理分析用于家蝇的检测。
Golhani等。(2018)使用可用的**中性网络技术来处理高光谱数据,这些数据特别侧重于植物病害检测。**Moshou等。(2004年)使用神经网络多层感知器来自动检测小麦中的黄锈病。使用ANN技术进行评估时,对总共5137个叶谱进行分类,分类性能从95%提高到了99%以上。
现代的植物病害检测方法包括将光谱和成像技术与自动农业工具相结合,后者可以在早期阶段提供有关疾病检测的信息,以控制植物病害的传播(Sankaran等,2010)。也可以使用分子方法和基于谱的技术。但是,在出现明显症状的情况下,首选成像和光谱技术,只需几分钟即可得出结果,并且可以远程处理。对来自高光谱和多光谱荧光成像的数据进行融合的目的是在可见症状出现之前及早发现疾病,并允许以94.5%的准确度与健康植物区分开。(Moshou等,2005)。高光谱成像是一种将宽光谱的光施加到每个像素的技术,并且撞击像素的光被分解成光谱并进行分析以提供信息。与柑橘绿化的情况一样,如果收集了健康植物和病态植物的热红外光谱反射率数据,则两者的反射率值会有所不同,因此,会根据特定区域中每个区域的反射率以这种方式进行分类 。类似地,还使用诸如荧光成像的技术,其中样品发出非常亮的荧光或发射光,与黑色背景形成对比。相反,红外热成像检测农作物中的温度信息。
植物病害检测平台(a):高光谱和叶绿素荧光成像(Bauriegel和Herppich,2014年)。(b):用于对香蕉植物进行疾病扫描的高光谱成像系统。(Ochoa et al。,2016)。(c):高光谱成像:从实验室到现场(Mahlein等,2017)。(d):用于柑橘绿化检测的红外和热成像(Sankaran等,2013)。
用于植物病害检测的成像技术
8.3 作物表型信息收集平台和传感器
-
在农作物表型中,需要以非常有效的方式收集空间和时间方面的信息,因此必须拥有强大的传感器系统。Bai等。(2016年)展示了一个由五个传感器组成的系统,即超声波距离传感器,热红外辐射计,NDVI传感器,便携式光谱仪和RGB网络摄像头,用于植物育种中的高通量表型分析。支持向量机和单纯形体积最大化之类的算法也用于分析,此外还包括工神经网络(ANN),高斯混合模型。一系列传感器可以与UAV平台集成,传感器用于测量植物对生物和非生物胁迫的响应。胁迫的例子有水分胁迫,植物养分缺乏胁迫和热胁迫。在模型中,使用偏最小二乘回归(PLSR),支持向量回归(SVR)和基于极限学习机的回归(ELR)技术,结合光谱指数/特征来预测作物参数。
-
自主的地面车辆也是作物表型的平台,例如能够测量植物秸秆强度并使用非接触式传感器阵列收集表型数据的机器人。另一个平台是基于塔的表型观察(Naito等人,2017)。还有两个平台组合而成的架构:自动地面车辆(Vinobot)和移动观测塔(Vinoculer)(Shafiekhani et al。,2017)。
-
无人机收集多光谱成像技术
作物表型的不同传感器平台
不同作物使用人工智能技术的研究。
8.4 未来发展
人工智能在农业中的最流行应用为农业机器人等类别。基于图像的预测分析,正在开发机器学习模型,以检查每天产生的大量数据,这些数据包括历史天气模式,土壤报告,新研究,降雨,病虫害,无人驾驶飞机和照相机的图像,这些数据可为提高作物产量提供强大的见解,进行图像预处理的疾病检测等。
8.5 结论
从研究的基础上可以推断出,在精确农业的支持下,可以使用科学方法(如遥感,GPS,数据分析等)进行更务实的农业,这有助于提高农业产量并减少潜在的环境风险。除此之外,借助图像识别软件,人工神经网络和许多其他工具,可以在早期发现疾病。由于早期作物的疾病检测 可以监控健康状况,并以最小或可忽略的损失获得高质量的生产率。农业上的人工智能还可以解决资源短缺和劳动力短缺等问题。
9. Image-based classification of plant genus and family for trained and untrained plant species (IF=2.511, 2019)
9.1 研究问题的提出
该论文通过深度学习技术对植物识别进行科属的自动分类。利用一组广泛的代表西欧被子植物区系的植物物种,我们调查了在物种、属和科三个分类层次上可达到的分类精度,以回答以下研究问题(Q):
Q1 分类精度是如何受到增加的类内视觉变异和类间视觉相似性的影响,当概括分类水平从种到属吗?
Q2 能否从物种的图像中学习到较高分类级别的明显视觉特征,以便于对未经过训练的物种进行分类分类?
Q3 哪些植物器官具有相同的视觉特征,可以进行正确的分类?
9.2 对提出问题展开研究
9.3 针对问题展开讨论
[个人总结]: 这篇论文的研究内容其实目前已经发展的很成熟了,内容的创新性不大。该论文在每一个讨论小节中都通过研究结果分析对提出的问题,做出具体了回答。这个地方值得借鉴,有问有答,有头有尾,论文结构整体性强。
9.4 采用的方法:CNN
*10. Current and future applications of statistical machine learning algorithms for agricultural machine vision systems (IF=3.998, 2019)
本文全面调查了统计机器学习技术在机器视觉系统中的应用现状,分析了每种技术在具体应用中的潜力,并概述了不同农业领域的指导性例子。针对特定的目的,给出了具体的统计机器学习技术的建议以及每种技术的局限性。讨论了统计机器学习技术应用的未来趋势。
10.1 介绍
讲述了深度学习在农业中的应用,如:叶片虫害识别、叶绿素预测、杂草检测、作物管理、叶片识别、产量预测、植物表型(胁迫预测)、水果、植物中的疾病检测、水果分级、土壤分析、管理区聚类、灌溉等。
论文目的是(i)使用统计机器学习(ML)算法概述在农业机器视觉系统领域中所做的工作(ii)突出显示针对特定农业应用的不同统计ML算法的局限性,以及(iii)建议 农业领域中每个特定区域的有效统计ML算法。
10.2 统计机器学习技术
10.2.1 监督机器学习算法
1. 朴素的贝叶斯 (Naïve bayes)
**Naive Bayes (NB)**算法是一种生成概率模型,基于预测变量/特征之间的条件独立性假设,即类中某个特征的存在与任何其他特征不相关(Frank et al., 2000)。朴素贝叶斯的条件独立性假设有助于计算样本数据的类条件概率,这些概率可以直接从训练数据中估计出来,而不是评估一个特征的所有可能性(Bishop, 2007)。
2. 判别分析(Discriminant analysis)
**判别分析(DA)**是一种生成模型,通过估计观测值的后验概率对观测值进行分类属于每个阶层(Lachenbruch, 1975)。后验概率由类成员的先验概率计算,并使用平方马氏距离估计每个类的多元正态分布(条件)(Klecka, 1980)。观察被分配给具有最高后验概率或马氏距离平方最小的类(Lachenbruch, 1975)。
3. K-Nearest Neighbour (KNN)
与NB和DA相对的kNN是有区别的,非参数的以及基于实例的分类器,它不会对每个类中的数据集的分布做出任何明确的假设(Bishop,2007年),因此可以适用于非高斯数据集。
4. 支持向量机(SVM)
SVM是二元分类器,能够将实验数据样本分为两个不相关的类别。 SVM的原理来自简化的情况,即这两个会计类别是线性可分离的。 存在能够区分两个类别中的所有数据样本的超平面。 SVM分类器还可用于对不可线性分离的数据进行分类。 数据空间被转换为一个高维空间,在该空间中,类可以线性分离。
5. 其他监督式学习
决策树,随机森林和逻辑回归等。
10.2.2 无监督机器学习算法
1. K均值聚类 (K-means clustering)
2. 模糊聚类 (Fuzzy clustering)
模糊聚类(也称为软聚类)可启用每个数据表示有可能属于每个(预定义)群集,而不是像传统的kmeans聚类算法那样仅属于一个聚类,模糊方法适用于在集群中心之间多少有些模棱两可的数据集。
3. 高斯混合模型(Gaussian mixture models ,GMM)
高斯混合模型与模糊混合模型相似,适用于真实聚类之间数据点重叠的情况。
4. 其他无监督机器学习算法
主成分分析(PCA)算法选择、隐马尔可夫模型(HMM)和关联分析 Apriori和FP-growth(频繁模式增长)算法。
10.2.3 强化机器学习算法
机器学习在很大程度上被归类为监督学习和无监督学习。然而,强化学习侧重于交互性目标导向的学习,可以通过交互性学习行为(Sutton and Barto, 1998)。强化学习的一个非常有前景的应用可以是自动化农业机器人/智能机器,因为它可以用来教机器人根据他们自己和周围环境之间的关系,在一段时间内改善他们的行为。该机器人可用于农业种植,精确地在一排种植作物,更均匀的种植大小。强化学习与机器人技术/智能机器可以很好地适应农民数量减少和作物产量增加的趋势(Bechar和Vigneault, 2016)。
10.3 结论
机器学习技术将适当的特征提取和选择过程与适当的预测算法结合在一起。 机器学习方法的潜在应用在很大程度上取决于机器学习算法在作物系统特定领域的适当应用。 基于目前用于机器视觉系统特征分析的机器学习技术和方法的研究动态,预计未来精确农业系统中特征数据分析的未来趋势。对论文中讨论的算法进行了以下总结:
-
**基于NB的ML算法适用于对数据分布和不同特征之间相关性有较强先验知识的任务。**可以看到,对于不同特征的组合,NB算法的表现并不好。这可能是因为该算法无法学习到特征之间的相互作用,因为特征之间存在相关性。但是,仔细的特征选择(使用PCA或其他特征选择程序)可以帮助实现特征的条件独立性。总结对NB的文献综述,47%的文献与农产品分级有关,29%用于作物病害检测,18%用于杂草检测,6%用于植物养分缺乏检测。
-
像NB一样,DA也适用于已知的数据分布;然而,这些类型的算法能够学习不同特征之间的交互作用。总体而言,非线性算法(QDA、KDA)的性能优于LDA和NB。总结DA的文献综述,50%的论文用于解决与农产品分级有关的问题,42%用于杂草检测,8%用于作物病害检测。
-
对于很少或根本不了解数据分布的应用程序,可以使kNN,因为它对数据不做任何假设。需要注意的是,kNN通常需要很长的处理时间。文献综述表明,结合不同的特征,kNN的表现优于NB。总结kNN的文献综述,47%的文献用于解决与农产品分级有关的问题,21%用于作物病害检测,16%用于杂草检测,剩下的用于营养缺乏、土地分类等。
-
尽管**支持向量机在培训和测试方面存在一些局限性,但该方法的有效性仍然有待提高分类器在植物病害检测和杂草识别中具有广阔的应用前景。**特别是在行作物种植中,基于支持向量机的机器学习分类器在田间条件和数据倾斜的地方非常有效。总结支持向量机的文献综述,70%用于作物病害检测,18%用于解决农产品分级问题,12%用于杂草检测。
-
在无监督ML算法中,**当数据点明显可分离时,可以使用K-means聚类,从而将数据点归为一类。**如果类有一些重叠,K-means算法是不合适的。k - means聚类综述文献的总结,论文的39%被用于解决农产品分级的问题,21%的人用于农作物疾病检测,18%的人用于杂草检测,11%被用于自动化的机器人应用程序和其他用于估产、作物行检测,树映射,可变利率(VR)灌溉和作物基因型分类。
-
基于模糊和GMM的算法适用于数据点在不同类之间重叠的情况。 这些是对模糊点分类K-means聚类的很好的替代方法。模糊聚类没有充分利用变量之间的相关性,因此不适用于空间相关的变量。对于这些具有相关性的情况,使用GMM。GMM可以用于关于数据分布的先验信息是已知的并且每个类都是正态分布的情况。基于模糊和GMM的算法在农产品中并不是很常见。总结回顾了文献中对模糊聚类,37%是用于杂草检测,31%的人用于站点特定的作物管理,19%的人用于作物疾病检测和其他作物行被用于检测和产量估算。在综述文献的总结GMM, 29%被用于植物表型出现技术,14%是用于作物疾病检测14%是用于VR灌溉和其他用于产量/压力估计,杂草检测,树木测绘和自动化机器人应用。
以上建议是基于统计ML算法在机器视觉中的应用。ML技术的未来应用将在农业上推广。**因此,本研究建议(但不限于)采用NB、DA、kNN、SVM和K-means聚类方法进行农产品分级、作物病害检测和杂草检测,采用模糊聚类方法进行作物定点管理和土壤分析,采用GMM方法进行植物表型/胁迫检测和水分含量测定。**尽管一些有监督的和无监督的ML算法,包括ANNs和深度学习(非统计ML)也被证明在农业作物生产中具有潜力,但是目前的研究不能覆盖所有这些技术。
[个人总结] 这篇论文主要总结了不同机器学习方法在农业的中的应用,综述了不同方法的特点以及它们适用于农业自动化检测的哪些方面。
11. A Mobile Application for Tree Classification and Canopy Calculation using Machine Learning (会议论文,2019)
这篇论文提出了一个新的机器学习的应用,通过一个移动应用程序,根据树的体积和叶片的数量的预测来计算农药(如杀虫剂)用量的信息。
11.1 介绍
在本文中,我们提供了一个这样的iOS应用程序,该应用程序可以获取树木或树叶的图像并返回树木类型的分类并估算其树冠体积,从而可以进一步降低用水效率。
11.2 方法: CNN
利用爬虫包[8]从谷歌ImageNet和Bing中采集这些树的图像,进行数据(图像)采集。从抓取的数据集中选择每种树类型的1000张图像。然后对图像进行预处理,减噪,统一尺寸等。这些数据形成了随后被创建并用于分类的机器学习模型的基础
11.3 机器学习
iOS被定位为移动平台的一个原因是使用了苹果的核心ML框架[9],如图1所示。这是许多iOS系统模块的基础。这包括用于分类器训练和模型生成任务的性能优化器和神经网络例程。Vision框架为核心ML提供可编程接口,用于树型标记的图像相关任务。
此外,该论文训练模型,怎么解决树目拍摄距离、角度的不同导致的精度降低。介绍了设计的app的功能,以及如何使用。
11.4 结论和未来的工作
本文介绍了一个iOS应用程序,该应用程序能够根据树木的图像及其叶子类型对树木类型进行分类。机器学习模型是使用Apple的Core和Create ML创建的。视觉框架用于处理图像并将其输入到ML模型中。该应用程序的第二个关键功能是使用树木的照片来确定照片的比例,从而估计树冠的体积,最后计算出树木的用水量。这是一个原型应用程序,可以帮助树木种植者获取有关树木的关键信息。将来可以进行很多改进。机器学习训练数据不是最佳的。树图像的背景中存在过多的噪声,这会影响模型的准确性。在将来的工作中,可以进行更多的预处理以优化图像,并且应该使用其他数据源以获得更高质量的图像。
目前,没有在单个过程中将树和叶子照片进行自动分类的自动分类。理想情况下,应用程序应该能够同时对树木和树叶的照片进行分类,以获得更高的准确性。机器学习模型的在线培训是将来要实施的另一个有益的功能。该模型可以在应用程序最初发布后继续学习,方法是交互地让用户评论或评估其自身的性能,从而获得更多的知识并进行长期培训。对于体积计算,可以改进用于确定树冠像素的算法。未来的工作可能包括更准确的算法来判断“绿色”像素的标准,以及更好的方法来区分树冠与其他树木和/或草。一种可能的解决方案是使用其他机器学习模型来首先确定主题树的边界框,这样就不会考虑图片的其他部分受干扰,提取的部分用于体积计算和分类。 。估算顶篷形状和体积的更准确方法是,使用从不同角度拍摄的照片建立3-D模型,而不是将每个图像视为一堆圆柱体并取平均值的当前方法。
[个人总结] 这篇论文介绍了作者设计的app来识别树木叶片体积,从而来帮助农民指导施肥量或者农业的使用量。论文的总结和未来展望写的很好,结合了自己设计的app的功能和实际遇到的问题对未来工作改进的方法提出了明确而详细的看法。
本文来自博客园,作者:落痕的寒假,转载请注明原文链接:https://www.cnblogs.com/luohenyueji/p/16970226.html