耕、林、园地分类搞不定?PIE-Engine机器学习带你攻克难题
由于耕、林、园地类型复杂且具有异物同谱等特点,在传统分类过程中无法有效区分,给耕地资源保护带来了困难,目前,基于遥感数据和机器学习算法进行土地利用分类已成为国内外学者的研究热点。本文结合时序影像中耕、林、园地的物候特征,基于PIE-Engine遥感计算云服务平台采用随机森林算法实现耕、林、园地的自动提取,助力耕地资源保护。
平台上常用的机器学习算法有:随机森林算法、决策树算法、支持向量机算法、贝叶斯算法等。
平台可提供的机器学习算法
研究区概况
研究区位于中国河北省保定市安国市,其地处华北平原腹地,位于北纬38°15′,东经115°10′至115°29′之间。该区域的土地利用类型以耕地为主,包括小麦、豆类等主要粮食作物,和药材、棉花、油料作物等经济作物;其他土地利用类型包括林地、园地、草地、水体、建设用地等。
河北省保定市安国市概况
分类方法
本文选取正射纠正后、无条带噪声且覆盖整个研究区的高质量Sentinel-2影像共计8景,获取时间段为2020年7月到2021年6月,空间分辨率10 m。由于耕、林、园地类型复杂且具有异物同谱等特点,且基于单时相遥感数据的提取效果较差,因此本文基于时间序列NDVI(Normalized Difference Vegetation Index)数据所反映的植被物候特征作为参考,分别采集耕、林、园地以及其他共4类697个样本点, 随机选择70%用于训练,其余30%用于精度验证,最终实现耕、林、园地的自动提取。对于分类结果,选用众数滤波消除边界小而无意义的点,具体操作过程如下:
耕、林、草地自动提取流程图
核心代码
分类结果
训练样本点、验证样本点分布
耕、林、草地自动提取结果
分类精度
本文对安国市土地利用进行分类,共分4类:耕地、林地、园地和其他,其中总体精度为93.55%,Kappa系数为0.89,混淆矩阵如下表。
结论
本文在充分考虑地物的时序变化趋势基础上,结合植被物候特征能够有效解决机器学习分类过程中异物同谱的问题,快速、高精度地对耕、林、园地进行自动分类。
示例代码
链接:https://engine.piesat.cn/engine/home?sourceId=8f1b6d3263ee444eb08b9d0db86af329