作物杂志, 2020, 36(6): 180-188 doi: 10.16035/j.issn.1001-7283.2020.06.027

农业信息技术

基于全波段高光谱的冬小麦生长参数估算方法比较

纪景纯,1,2, 刘建立1, 牛玉洁1,2, 宣可凡1,2, 蒋一飞1,2, 邓皓东1,3, 李晓鹏,1

1中国科学院南京土壤研究所,210008,江苏南京

2中国科学院大学,100049,北京

3河海大学水文水资源学院,210008,江苏南京

Comparison of Estimation Methods for Growth Parameters of Winter Wheat Based on Full-Band Hyperspectral Data

Ji Jingchun,1,2, Liu Jianli1, Niu Yujie1,2, Xuan Kefan1,2, Jiang Yifei1,2, Deng Haodong1,3, Li Xiaopeng,1

1Institute of Soil Science, Chinese Academy of Sciences, Nanjing 210008, Jiangsu, China

2University of the Chinese Academy of Sciences, Beijing 100049, China

3Hydrology and Water Resources College, Hohai University, Nanjing 210008, Jiangsu, China

通讯作者: 李晓鹏,主要从事农田信息精准监测,E-mail: lixp@issas.ac.cn

收稿日期: 2020-02-26   修回日期: 2020-04-24   网络出版日期: 2020-12-15

基金资助: 国家重点研发计划(2016YFD0300601)
国家自然科学基金面上项目(41877021)
国家自然科学基金面上项目(41771265)

Received: 2020-02-26   Revised: 2020-04-24   Online: 2020-12-15

作者简介 About authors

纪景纯,主要从事植物营养与无人机遥感研究,E-mail: jcji@issas.ac.cn

摘要

利用高光谱数据监测作物生长情况具有无损和高效的特点,是现代农业的发展方向。为了简化高光谱数据处理流程,直接利用原始的高光谱反射率完成从建模到估算作物生长参数的全过程,应用于作物长势的实时监测。本文利用偏最小二乘回归(partial least squares regression,PLSR)、支持向量回归(support vector regression,SVR)和前馈神经网络(feedforward neural network,FNN)3种方法,利用全波段高光谱数据分别对冬小麦多个关键生育期(拔节、孕穗、扬花和乳熟期)生长参数(地上部生物量、叶面积指数、全氮含量和叶绿素浓度)进行了估算。比较3种方法的建模及估测效果,发现对于建模集数据,SVR对上述生长参数4个生育期的估测结果R2均值为0.89~0.98,MAPE为1.70%~7.53%,对于验证集数据,R2均值为0.90~0.94,MAPE为4.04%~7.46%,拟合优度和估测精度均超过PLSR和FNN,是估算方法中利用全波段光谱反射率估测冬小麦生长参数的最佳方案。随着无人机载高光谱技术成熟,SVR方法能够用于处理航拍获取的大范围田间高光谱信息,简便快捷地进行建模与参数反演,实时反映作物生长状态。

关键词: 高光谱遥感 ; 偏最小二乘回归 ; 支持向量回归 ; 前馈神经网络 ; 作物生长监测

Abstract

Hyperspectral data monitoring in crop growth status has the characteristics of nondestructive and efficient, which will be the developing direction of modern agriculture. In order to simplify the hyperspectral data processing procedure and apply to the real-time monitoring of crop growth, the original hyperspectal reflectance was directly used to complete the whole process from modeling to estimating the crop growth patameters and three methods including partial least square regression (PLSR), support vector regression (SVR) and feed forward neural network (FNN) were used to estimate the growth parameters (aboveground biomass, leaf area index, total nitrogen content and chlorophyll concentration) of winter wheat at multiple key growth stages (jointing, booting, anthesis and milk ripe stage) based on full-band hyperspectral data, respectively. The modeling and estimation performances of the three methods were also compared. For the SVR method, the mean R2 of the above growth parameters during the four growth periods was between 0.89 and 0.98, while MAPE was between 1.70% and 7.53% in calibration set and the mean R2 of the above growth parameters during the four growth periods was between 0.90 and 0.94, while MAPE was in between 4.04% and 7.46% in validation set. Both the interpretation of parameters and the estimation accuracy were higher than PLSR and FNN methods, which illustrated that the SVR method performed best in estimating winter wheat growth parameters using all-band spectral reflectance in the tested methods. With the maturity of UAV-based hyperspectral technology, the SVR method can be used to process a wide range of field hyperspectral information obtained fromaerial photography, facilitate modeling and parameter inversion, and reflect crop growth status in time.

Keywords: Hyperspectral remote sensing ; Partial least squares regression ; Support vector regression ; Feedforward neural network ; Monitoring of crop growth parameters

PDF (5449KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

纪景纯, 刘建立, 牛玉洁, 宣可凡, 蒋一飞, 邓皓东, 李晓鹏. 基于全波段高光谱的冬小麦生长参数估算方法比较[J]. 作物杂志, 2020, 36(6): 180-188 doi:10.16035/j.issn.1001-7283.2020.06.027

Ji Jingchun, Liu Jianli, Niu Yujie, Xuan Kefan, Jiang Yifei, Deng Haodong, Li Xiaopeng. Comparison of Estimation Methods for Growth Parameters of Winter Wheat Based on Full-Band Hyperspectral Data[J]. Crops, 2020, 36(6): 180-188 doi:10.16035/j.issn.1001-7283.2020.06.027

开放科学(资源服务)标识码(OSID):

利用高光谱遥感进行作物生长状态的监测具有无损、高效和灵敏的特点,前人对基于高光谱数据的生长参数估算开展了大量的研究。Li等[1]根据可变重要性值(variable importance in projection,VIP)对光谱反射率、光谱一阶导数、反射/吸收位置和植被指数进行筛选,最终利用筛选出的14个特征建立了偏最小二乘回归(partial least squares regression,PLSR)反演叶面积指数(leaf area index,LAI)模型,决定系数(R2)达到0.88,均方根误差(RMSE)为0.943,通过特征筛选保留了高光谱的有效信息,在减少运算量同时保证了反演精度。Jia等[2]使用连续投影算法(successive projections algorithm,SPA)结合协同区间偏最小二乘法(synergy interval partial least squares,SIPLS)处理高光谱数据,筛选出8个特征波段,建立叶片生物量的反演方程,建模集R2达0.79,验证集RMSE为0.059kg/m2,较其他的特征选择技术提供了更少的不相关、非共线性的光谱变量,降低了模型整体的复杂度,缩短了模型运行时间。Duan等[3]考虑了氮的垂直分布特征,基于绿度指数(GI)、修正归一化差值(mND705)和归一化差分植被指数(NDVI)分别建立了冬小麦叶片总氮浓度线性模型,提出了不同生育期遥感探测的有效冠层,该方法建立的反演模型R2和归一化均方根误差(nRMSE)分别为0.61和8.84%、0.59和8.89%、0.53和9.37%,显著提高了对叶片氮含量的反演精度和模型的稳定性。Huang等[4]则通过相关性分析,利用450~488nm和500~540nm范围的一阶导数之和构建了小麦赤霉病指数(wheat scab index,WSI),利用新指数与其他传统植被指数构建的多重逐步回归模型预测病情等级,发现WSI较常规指数与病情等级具有更显著的线性关系,针对性的新指数提高了对病情的判断水平。前人反演作物参数多侧重于数据降维,提取高光谱的有效信息,针对不同的监测指标筛选出了不同的特征并建立了相应的参数反演模型,回归方法以PLSR为主。特征筛选和建模过程需要一定的先验知识,且降维过程本身比较复杂,在实际应用过程中,往往需要对同一时期的多种生长参数进行快速监测。

机器学习模型以其强大的数据处理能力和不需要先验知识的特点在作物参数反演中有很大的优势。Bao等[5]在使用成像高光谱数据进行小麦品种分类研究中,使用线性判别分析(linear discriminant analysis,LDA)、支持向量机(support vector machine,SVM)和极限学习机(extreme learning machine,ELM)分别对全波段和使用主成分分析(principal component analysis,PCA)、连续投影算法(SPA)和随机蛙跳(random frog,RF)筛选的特征波段建立分类模型,基于全波段光谱反射率建立的ELM模型分类效果最优。机器学习模型可以用于全波段的高光谱数据处理,不进行特征筛选的降维过程,极大地简化了高光谱数据的应用流程。为了简化作物参数从建模到估算的整体过程,找出可以直接用于批量处理冠层高光谱数据,实时监测作物生长状态的方法,本研究选择广泛使用的PLSR和不依赖于先验知识的机器学习方法支持向量回归(SVR)和前馈神经网络(FNN)进行了利用全波段高光谱数据估算生长参数的方法比较[6,7]

1 材料与方法

1.1 试验设计

试验地点位于河南省封丘县潘店乡,该地区年均气温13.9℃,无霜期220d左右,全年日照时数为2 300~2 500h,土壤类型主要为黄河沉积物发育的轻壤质潮土,主要的作物栽培模式为冬小麦–夏玉米轮作制度。

试验于2018-2019年冬小麦生长季进行,供试品种为百农矮抗58。根据当地农户的常规施氮量190kg/hm2,设置N0、N1、N2、N3、N4 5个氮肥梯度,单季小麦施氮量分别为0、150、190、230和270kg/hm2,应用尿素作为单一氮源,60%作为基肥,40%作为追肥。磷肥用量为130 P2O5 kg/hm2,钾肥用量为120 K2O kg/hm2,不进行差异处理。N0、N1、N3和N4处理重复9次,N2处理重复12次,共计48个小区。种植前翻耕1次,基肥深施,追肥撒施。试验地的单元面积为48m2(8m×6m),试验单元四周埋设80cm深的混凝土板防止土壤溶液侧向交换。该试验地的连续氮肥梯度处理超过10年,不同氮肥处理的冬小麦生长差异显著,为建立生长参数估算模型提供了各类型样本。

图1

图1   氮肥梯度试验布置

N0、N1、N2、N3和N4分别为0、150、190、230和270kg/hm2

Fig.1   Experimental design of nitrogen rate test

N0, N1, N2, N3 and N4 indicate 0, 150, 190, 230 and 270kg/hm2


1.2 数据采集

根据冬小麦追肥和产量形成的关键时期,试验于返青拔节期(3月25日)、孕穗期(4月16日)、扬花初期(4月28日)和乳熟初期(5月18日)进行地面生长参数和冠层高光谱数据的采集。

1.2.1 地面生长参数的测定 监测的生长参数包括地上部生物量(aboveground biomass,AGB)、叶面积指数(leaf area index,LAI)、全氮含量(total nitrogen content,N)和叶绿素浓度(chlorophyll concentration, CC)。除全氮含量外,在每个小区内按照五点取样法进行数据采集,总样本容量为240株。

AGB为单株小麦烘干重均值与种植密度的乘积:小麦烘干重均值在每个采样点取5株,105℃杀青30min,再将温度调至80℃烘干至恒重;种植密度为1m2内小麦种植的行数与单行内实测的小麦株数的乘积。使用北京澳作生态仪器有限公司的SunScan冠层分析仪,选择晴朗的天气于10∶00-14∶00测定LAI;将每小区5个取样点的样品混合粉碎后按照凯氏定氮法测定全氮含量;使用美国Apogee公司生产的MC-100植物叶绿素仪测定叶绿素浓度,每个取样点选取1株分别测定顶部功能叶和植株中部叶片的叶基、叶中和叶尖,共6个点,计算均值代表该取样点叶绿素浓度。

1.2.2 冠层光谱反射率的采集 根据前人的研究,与作物各项生长参数相关的光谱范围主要在可见~近红外区间(叶绿素400~700nm,植株氮素含量450~520、515~585、625~695、730和930nm,地上部干生物量650~700、500~550和900~940nm),总体而言,400~1 000nm的光谱范围能够反映作物的生长状况[8,9,10]。为了减少输入特征总量,提高运算效率,使用ASD Field Spec 4便携式光谱仪中VNIR探测器所监测的光谱范围(350~1 000nm),剔除噪声干扰,最终选取400~1 000nm的光谱反射率。光谱采样间隔为1.4nm,光谱分辨率为3nm。该波段范围也是目前广泛使用的无人机载高光谱仪器的监测范围,利用该范围高光谱数据进行的建模比较,对样本量大的无人机载数据处理具有参考价值[6,11]。选择晴朗的天气于10∶00-14∶00进行测定,探测器距冠层20cm,监测点与取样点位置相同。

1.3 数据建模方法

对PLSR、SVR和FNN 3种建模方法进行比较。其中PLSR是目前广泛使用的高光谱数据处理方法;SVR模型对高维度、小样本数据有较好的处理能力;FNN是研究较多、成熟且广泛使用的机器学习方法。在每个处理内按照7∶3的比例随机划分建模集与验证集,随后合并为整体的建模集与验证集。

1.3.1 PLSR PLSR是一种多自变量对多因变量的线性回归建模方法,可以同时实现提取变量特征、分析变量间相关性和回归建模,适合多元数据的统计分析。当自变量个数多、存在多重相关性且观测数据样本量较小时,PLSR具有传统的经典回归分析方法所没有的优势。使用PLSR建模的过程:假定p个自变量{X1,...,Xp}和q个因变量{Y1,…,Yq},在XY中分别提取出成分t1u1,使t1u1尽可能大地携带他们各自数据表中的变异信息,且t1u1的相关程度最大。第一对成分t1u1被提取后,分别实施Xt1以及Yu1的回归。若回归方程此时交叉有效性小于0.0975,则成分确定;否则将利用Xt1以及Yu1解释后的残余信息进行第二轮的成分t2u2提取,继续实施XYt2u2的回归,对上述过程进行迭代,直到满足精度要求为止[1,12]

1.3.2 SVR SVR是Vapnik在长期系统的统计学理论研究基础上提出的机器学习算法[13],其基本思想是寻找最优的超平面,使所有样本点距离超平面的总体偏差最小,即所有样本的类内方差最小。对于不可分的非线性数据,SVR使用核函数将低维数据映射到高维空间,在高维空间找到线性可分的超平面,能够很好地解决高维特征的回归问题。当样本不是海量数据时,使用SVR进行回归的准确率高且泛化能力强[14],适用于自变量维度大于样本量且样本总量较小的全波段光谱估算生长参数问题。根据前人的研究,推荐在缺乏先验知识的条件下使用径向基核函数(RBF),核函数系数(g)和惩罚系数(C)是SVR模型的重要参数,前者影响模型的复杂程度和泛化能力,后者表征模型对离群点的重视程度。gC系数通过6折交叉验证确定,误差阈值设为10-7

1.3.3 FNN FNN是一种模仿生物神经网络结构和功能的计算模型,用于估算函数。FNN包括输入层、隐含层和输出层,每一层的神经元接受前一层的输出,处理后传输给下一层,数据单向流动。神经网络的每一层与下一层之间都存在一个参数矩阵,首先随机初始化每一层的参数矩阵,然后从输入层开始,依次计算下一层每个神经元的激活值,直到计算出输出层神经元的激活值。对于维度较高的线性不可分数据,与线性回归和SVR不同,神经网络通过线性分类器的叠加组合完成分类,同时避免增加无效维度。对于高光谱数据处理分析同样适用。隐层节点数是重要的模型参数,节点数的设置对模型的拟合效果和泛化能力影响巨大。根据国内外的应用实例,隐层节点数的经验公式为$N=\alpha +\sqrt{m+n}$,N为隐层节点数,α为1~10之间的整数,m为输入神经元数,n为输出神经元数[15]

本试验中隐层节点数通过3折交叉验证进行选择。输入特征为400~1 000nm光谱反射率,输入层节点数601个,输出值为相应的生长参数,输出层节点数为1。根据隐层节点数经验公式得到本试验的推荐隐层节点数范围25~35。设置隐层节点数5、15、20、25、30、35进行建模比较。根据预试验建模结果的均值,选择满足模型拟合优度R2大于0.90,均方根误差RMSE与最小值相差较小的节点数设置;在不影响估算精度和拟合优度的条件下,结合运算效率,优先选择较小的节点数。最终的设置结果见表1

表1   FNN隐层节点数设置

Table 1  Number of nodes in the hidden layer of FNN

生长参数
Growth parameter
拔节期
Jointing
stage
孕穗期
Booting
stage
扬花期
Anthesis
stage
乳熟期
Milk ripe
stage
地上部生物量Aboveground biomass15151515
LAI15252515
全氮含量
Total nitrogen content
25151515
叶绿素浓度
Chlorophyll concentration
25251515

新窗口打开| 下载CSV


1.4 模型评价指标

模型评价包括对建模效果和估算效果的评价,主要选用以下参数:

决定系数$R^{2}=\frac{\sum_{t=1}^{n}(obs_{t}-\overline{obs})(pre_{t}-\overline{pre})}{\sqrt{\sum_{t=1}^{n}(obs_{t}-\overline{obs})^{2}\cdot\sum_{t=1}^{n}(pre_{t}-\overline{pre})^{2}}}$

均方根误差$RMSE=\sqrt{\frac{\sum_{t=1}^{n}(obs_{t}-pre)^{2}}{n}}$

平均绝对百分比误差$MAPE=\sum\limits_{t=1}^{n}|\frac{obs_{t}-pre_{t}}{obs_{t}}|\times \frac{100}{n}$

3个公式中obs为生长参数实测值,pre为生长参数的预测值。建模集和验证集的R2越大,RMSEMAPE越小,模型的建模及估算效果越好[16]。所有评价指标均计算10折交叉验证的均值。

2 结果与分析

2.1 不同氮肥梯度下冬小麦生长参数及冠层光谱

图2可知,拔节期和孕穗期,AGB随施氮量增加而上升,不施氮(N0)、缺氮(N1)、常规施氮(N2、N3)与过量施氮(N4)间差异显著。扬花期,不缺氮处理(N2、N3、N4)间差异不显著,与缺氮处理差异显著,N2、N3、N4较N0高730~742g/m2,较N1高98~111g/m2。乳熟期,N4显著高于其他处理,N0显著低于其他处理。5个处理中N0 LAI全生育期最低(0.40~1.16),N1次之(1.49~4.05),且二者与其他处理差异显著。拔节期和孕穗期不缺氮处理(N2、N3和N4)间差距小。扬花期和乳熟期,不施氮、缺氮、常规施氮与过量施氮间差异显著。拔节期N3全氮含量最高达到2.21%,且5个氮肥梯度间差异显著。其余生育期N4最高,但与N3差异不显著,仅在乳熟期显著高于其他处理,与N3差值为0.18%。N0和N1与其他处理差异显著。总体趋势表现为随着施氮量的增加全氮含量也相应增加,且所有处理在乳熟初期全氮含量均有所下降。在5个氮肥梯度中N0叶绿素浓度全生育期均最低(117.6~221.4μmol/m2),且在乳熟期下降了103.8μmol/m2;N1略高(421.9~458.3μmol/m2),但全生育期波动小;N4叶绿素浓度最高,除拔节期与N3差异不显著外,其余生育期均显著高于其他处理。常规施氮处理,叶绿素浓度全生育期波动较小,N2为453.4~526.8μmol/m2,N3为465.9~542.9μmol/m2

图2

图2   不同氮肥梯度下冬小麦生长参数

不同小写字母表示在0.05水平下差异显著

Fig.2   Growth parameters of winter wheat under different nitrogen fertilizer gradients

Different lowercase letters indicate significant difference at 0.05 level


图3可知,N0处理冠层光谱反射率在绿峰处反射率较其他处理高,全生育期差值0.04%~0.15%;在红谷处反射率较其他处理高0.02%~0.20%。总体趋势上,随着氮肥施用量的增加,红边~近红处的反射率上升。拔节期N1、N2、N3和N4处理该处反射率与N0差值分别为0.03%、0.05%、0.10%和0.10%,孕穗期N1与N0差值为0.20%,其余处理与N0差值为0.25%,扬花期N1与N0差值为0.23%,其余处理与N0差值为0.25%,乳熟初期N1与N0差值为0.08%,其余处理与N0差值为0.12%。除拔节期外,不缺氮处理间(N2、N3和N4)的冠层光谱差异主要表现为绿峰反射值不同。长期不施氮处理N0整体长势及光谱反射率均与其他处理差距较大,其余处理间的差异远小于较不施氮处理的差异,数据分布呈两簇分布。

图3

图3   不同氮肥梯度下冬小麦冠层光谱反射率

Fig.3   Canopy hyperspectral reflectance of winter wheat under different nitrogen fertilizer gradients


2.2 PLSR、SVR和FNN的建模效果比较

在1.3中确定的参数设置下,分别采用PLSR、SVR和FNN对拔节–乳熟期各生长参数进行建模,图4为建模集数据的估算散点图,表2为建模评价指标的10折验证的均值。3种方法的地上部生物量在拔节期和孕穗期拟合优度均低于扬花期和乳熟期,其中孕穗期PLSR的R2最低,仅有0.87,而乳熟期SVR和FNN的R2则高达0.95。两种机器学习模型在扬花期、乳熟期R2为0.94~0.95,MAPE为5.25%~5.59%,优于PLSR,且SVR的精度稍高于FNN。不同生育期3种方法LAI的建模效果均稳定,PLSR的R2稍低于SVR和FNN,MAPE分别高2.20%~4.67%和1.20%~3.40%。SVR和FNN全氮含量的MAPE分别较PLSR低29.28%~65.73%和22.07%~57.06%,R2分别高3.19%~8.89%和2.20%~7.78%,SVR和FNN之间建模效果相近。3种方法中,SVR对叶绿素浓度的建模效果最优,全生育期MAPE为4.70%~6.49%,R2为0.89~0.96。

图4

图4   PLSR、SVR和FNN模型对建模集样本的估算结果

Fig.4   Fitted results for calibration samples of PLSR, SVR and FNN model


表2   PLSR、SVR和FNN模型的建模评价指标

Table 2  The evaluation indicators of PLSR, SVR and FNN model in calibration set

模型Model生育期
Growth stage
地上部生物量
Aboveground biomass
LAI全氮含量
Total nitrogen content
叶绿素浓度
Chlorophyll concentration
R2RMSE
(g/m2)
MAPE
(%)
R2RMSEMAPE
(%)
R2RMSE
(%)
MAPE
(%)
R2RMSE
(μmol/m2)
MAPE
(%)
PLSR拔节期Jointing0.9018.6110.580.930.139.430.900.124.960.9134.517.03
孕穗期Booting0.8763.878.730.950.349.220.920.093.360.9137.436.65
扬花期Anthesis0.9279.836.570.930.398.460.910.104.440.8650.928.40
乳熟期Milk ripe0.91124.838.090.940.367.840.940.136.400.9435.018.19
SVR拔节期Jointing0.9216.317.530.950.115.460.980.051.700.9428.024.93
孕穗期Booting0.9153.306.360.970.254.550.970.051.700.9332.545.32
扬花期Anthesis0.9472.775.380.940.355.960.940.083.140.8945.006.49
乳熟期Milk ripe0.9594.465.250.950.325.650.970.103.540.9626.254.70
FNN拔节期Jointing0.9315.377.580.960.106.030.970.062.130.9624.504.45
孕穗期Booting0.9249.696.800.960.295.960.960.072.250.9333.445.26
扬花期Anthesis0.9471.725.490.950.357.130.930.093.460.9045.007.35
乳熟期Milk ripe0.9593.575.590.960.306.650.970.104.240.9627.705.93

新窗口打开| 下载CSV


PLSR全生育期对建模集的反演精度均低于两种机器学习方法,MAPE在6.65%~8.40%之间。SVR对地上部生物量、LAI、全氮含量和叶绿素浓度建模的全生育期R2均值分别为0.93、0.95、0.97和0.93,较PLSR分别提高了3.33%、1.60%、5.18%和2.76%;FNN较PLSR分别提高了3.89%、2.13%、4.36%和3.59%。总体而言,SVR的建模效果最优。

2.3 PLSR、SVR和FNN的估算效果比较

将2.2中构建的模型用于对应的验证集数据,比较3种方法的估算效果。图5为验证集估算参数散点图,表3为验证集的评价指标均值。全生育期SVR的地上部生物量拟合优度和估算精度均高于PLSR和FNN,尤其是估算精度,MAPE较PLSR和FNN分别降低了5.73%~22.78%和10.74%~17.40%,RMSE分别降低了4.04%~18.51%和6.85%~12.06%。各生育期SVR和PLSR的LAI拟合优度相近,但SVR的估算精度更高,MAPE较之降低了10.63%~35.07%。SVR拟合优度R2比FNN高1.09%~4.35%,估算精度也更高,MAPE比FNN低17.10%~28.63%。除扬花期外,SVR全氮含量的估算效果均优于PLSR和FNN,R2分别提高了1.06%~5.56%、1.06%~2.20%,MAPE分别降低了9.23%~33.33%、14.47%~18.18%。扬花期3种模型估算性能相当,PLSR精度略高。全生育期SVR叶绿素浓度的估算效果均优于PLSR和FNN。除扬花期外,SVR的R2较PLSR提高了1.06%~1.10%,MAPE降低了9.15%~20.14%;SVR的R2较FNN提高了1.06%~4.55%,MAPE降低了19.80%~21.33%。只有扬花期SVR的优势不明显,拟合优度与PLSR和FNN相同,RMSE较PLSR高1.17%,但MAPE较之低2.41%,较FNN低6.89%。

图5

图5   PLSR、SVR和FNN模型对验证集样本的估算结果

Fig.5   Predicting result of growth parameters of PLSR, SVR and FNN model


表3   PLSR、SVR和FNN模型的估算评价指标

Table 3  The evaluation indicators of PLSR, SVR and FNN model in validation set

模型
Model
生育期
Growth stage
地上部生物量
Aboveground biomass
LAI全氮含量
Total nitrogen content
叶绿素浓度
Chlorophyll concentration
R2RMSE
(g/m2)
MAPE
(%)
R2RMSEMAPE
(%)
R2RMSE
(%)
MAPE
(%)
R2RMSE
(μmol/m2)
MAPE
(%)
PLSR拔节期Jointing0.8920.0311.150.920.1410.750.900.125.310.9134.677.13
孕穗期Booting0.8764.198.730.950.359.440.920.093.360.9137.316.78
扬花期Anthesis0.9280.706.600.930.408.620.910.114.570.8650.388.31
乳熟期Milk ripe0.91127.588.340.940.378.000.940.136.460.9436.018.44
SVR拔节期Jointing0.9019.099.160.930.136.980.950.083.310.9233.136.36
孕穗期Booting0.8959.998.230.960.316.690.930.083.050.9235.206.16
扬花期Anthesis0.9377.445.990.930.397.380.900.114.770.8650.978.11
乳熟期Milk ripe0.94103.966.440.940.357.150.950.115.040.9531.266.74
FNN拔节期Jointing0.8820.8211.090.920.148.420.940.103.870.8939.247.93
孕穗期Booting0.8764.409.220.920.429.260.910.093.630.8844.207.83
扬花期Anthesis0.9188.017.190.900.4910.340.900.114.760.8652.528.71
乳熟期Milk ripe0.92118.217.510.920.429.600.940.136.160.9436.618.44

新窗口打开| 下载CSV


SVR对地上部生物量、LAI、全氮含量和叶绿素浓度估算的全生育期MAPE均值分别为7.46%、7.05%、4.04%和6.85%,较PLSR的均值分别低1.25%、2.15%、0.88%和0.82%;较FNN的均值分别低1.30%、2.36%、0.56%和1.39%;估算的R2全生育期均值分别为0.90、0.94、0.92和0.91,对所有生长参数均高于PLSR和FNN;对4种生长参数所估算的RMSE全生育期均值在3种模型中也最低。SVR在3种模型中对验证集数据生长参数变异性解释力最强,估算精度最高。

在8核16G的配置下,从建模到结果估算耗时比较,PLSR仅需几十秒,SVR耗时在10min以内,FNN耗时需要数小时。

3 讨论

本研究选取冬小麦冠层光谱400~1 000nm波段反射率,采用PLSR、SVR和FNN对冬小麦全生育期地上部生物量、LAI、全氮含量和叶绿素浓度进行建模估算,发现3种模型对生长参数变异情况的解释性都较高,R2均在0.86以上。3种建模方法中,SVR模型全生育期MAPE均值分别为7.46%、7.05%、4.04%和6.85%,R2均值分别为0.90、0.94、0.92和0.91,总体估算效果在3种参与比较的建模方法中最优,与梁栋等[17]LAI发现的最优估算方法的结果一致,说明SVR在多种生长参数的建模估算方面均优于PLSR,更适用于作物监测。本研究通过对不同生育期参数分时期建模,取得了较好的估测结果。与贺佳等[18]利用高光谱植被指数分时期监测冬小麦地上部生物量的结果相近,R2稍高于贾学勤等[19]利用多种植被指数结合PLSR的生物量监测结果,说明分时期进行生长参数监测能够有效改善高光谱遥感监测效果。通过综合比较多种生长参数的最优估算时期,发现地上部生物量最佳监测时期为扬花初期;LAI全生育期估算结果波动较小;全氮含量在返青拔节–孕穗期估算精度稍高于扬花–乳熟期;叶绿素浓度不适于在扬花初期进行估算。

与传统的特征筛选、降维再建模的监测方法相比,本研究通过使用全波段高光谱反射率直接参与建模,虽然没用显著提高监测精度,但是以较少的运算量简化了数据处理的流程,有利于高光谱数据在实际农业监测中的应用推广。

4 结论

PLSR、SVR和FNN 3种方法均能实现全波段高光谱反演作物生长参数的目标。就建模过程而言,PLSR最为简单,只需要设置交叉验证的阈值;SVR需要根据推荐选择核函数,交叉验证设置核函数系数;FNN则需要通过预试验进行人为选择隐层节点数,相对复杂。对于建模集的预测性能,FNN和SVR两种机器学习方法均优于PLSR,对参数的解释性和精度均较高。对于独立的验证数据,SVR的估算性能最优,PLSR次之,FNN由于需要大量的样本进行训练,同时存在陷入局部最优解的问题,对于验证数据的估算表现不佳。

传统的高光谱数据建模处理采用先降维后建模方法,一定程度上提高了运算速率,但面向多元监测指标时,建模反演整体过程复杂。随着运算力的不断提升和对高维数据的处理能力不断提高,特征数量对数据处理与分析的制约越来越小。本研究使用原始冬小麦冠层光谱反射率进行建模,简化了特征筛选的过程,达到了理想的估算结果,为高光谱数据的处理提供了新的思路。在利用全波段高光谱估算冬小麦生长参数的试验中,SVR在估测方法中表现最优,同时运算速率适中,可以满足大面积作物生长状况实时监测的需求。

参考文献

Li X C, Zhang Y J, Bao Y S, et al.

Exploring the best hyperspectral features for LAI estimation using partial least squares regression

Remote Sensing, 2014,6(7):6221-6241.

DOI:10.3390/rs6076221      URL     [本文引用: 2]

Jia M, Li W, Wang K K, et al.

A newly developed method to extract the optimal hyperspectral feature for monitoring leaf biomass in wheat

Computers and Electronics in Agriculture, 2019,165(1):1-7.

[本文引用: 1]

Duan D D, Zhao C J, Li Z H, et al.

Estimating total leaf nitrogen concentration in winter wheat by canopy hyperspectral data and nitrogen vertical distribution

Journal of Integrative Agriculture, 2019,18(7):1562-1570.

DOI:10.1016/S2095-3119(19)62686-9      URL     [本文引用: 1]

Huang L S, Zhang H S, Ding W J, et al.

Monitoring of wheat scab using the specific spectral index from ASD hyperspectral dataset

Journal of Spectroscopy, 2019: 9153195.

[本文引用: 1]

Bao Y D, Mi C X, Wu N, et al.

Rapid classification of wheat grain varieties using hyperspectral imaging and chemometrics

Applied Sciences, 2019,9(19):4119-4135.

DOI:10.3390/app9194119      URL     [本文引用: 1]

田明璐, 班松涛, 常庆瑞, .

基于无人机成像光谱仪数据的棉花叶绿素含量反演

农业机械学报, 2016,47(11):285-293.

[本文引用: 2]

梁栋, 杨勤英, 黄文江, .

基于小波变换与支持向量机回归的冬小麦叶面积指数估算

红外与激光工程, 2015,44(1):335-340.

URL     [本文引用: 1]

R2)明显高于冠层反射率的回归确定系数;利用小波系数与LAI 建立的SVR 模型的反演精度最高,模型实测值与预测值的检验精度(R2)为0.86,均方根误差(RMSE)为0.43;而常用植被指数(归一化植被指数,NDVI;比值植被指数,RVI)建立的估测模型对冬小麦多个生育时期LAI 反演精度最低(R2 <0.76,RMSE>0.56)。因此利用连续小波变换进行数据预处理,能更好地筛选出对叶面积指数敏感的信息,LAI 回归方法比较结果表明,SVR 比PLS 更适合于LAI 的估测,通过将CWT 与SVR 结合(CWT-SVR)能实现不同生育时期冬小麦叶面积指数的遥感估算。]]>

Curran P J, Dungan J L, Macler B A, et al.

Reflectance spectroscopy of fresh whole leaves for the estimation of chemical concentration

Remote Sensing of Environment, 1992,39(2):153-166.

DOI:10.1016/0034-4257(92)90133-5      URL     [本文引用: 1]

Osborne S, Schepers J S, Schlemmer M.

Using multi-spectral imagery to evaluate corn grown under nitrogen and drought stressed conditions

Journal of Plant Nutrition, 2004,27(11):1917-1929.

DOI:10.1081/PLN-200030042      URL     [本文引用: 1]

Thenkabail P S, Smith R B, De Pauw E.

Hyperspectral vegetation indices and their relationships with agricultural crop characteristics

Remote Sensing of Environment, 2000,71(2):158-182.

DOI:10.1016/S0034-4257(99)00067-X      URL     [本文引用: 1]

陆国政, 李长春, 杨贵军, .

基于成像高光谱仪的大豆叶面积指数反演研究

大豆科学, 2016,35(4):599-608.

[本文引用: 1]

Svante W, Sjöström M, Eriksson L.

PLS-regression:a basic tool of chemometrics

Chemometrics and Intelligent Laboratory Systems, 2001,58(2):109-130.

DOI:10.1016/S0169-7439(01)00155-1      URL     [本文引用: 1]

Cherkassky V.

The nature of statistical learning theory

IEEE Transactions on Neural Networks, 1997,8(6):1564.

DOI:10.1109/TNN.1997.641482      URL     PMID:18255760      [本文引用: 1]

Hsu C W, Lin C J.

A comparison of methods for multiclass support vector machines

IEEE Transactions on Neural Networks, 2002,13(2):415-425.

DOI:10.1109/72.991427      URL     PMID:18244442      [本文引用: 1]

Support vector machines (SVMs) were originally designed for binary classification. How to effectively extend it for multiclass classification is still an ongoing research issue. Several methods have been proposed where typically we construct a multiclass classifier by combining several binary classifiers. Some authors also proposed methods that consider all classes at once. As it is computationally more expensive to solve multiclass problems, comparisons of these methods using large-scale problems have not been seriously conducted. Especially for methods solving multiclass SVM in one step, a much larger optimization problem is required so up to now experiments are limited to small data sets. In this paper we give decomposition implementations for two such

Fulkerson B.

Machine learning,neural and statistical classification

Technometrics, 1997,37(4):459-459.

DOI:10.1080/00401706.1995.10484383      URL     [本文引用: 1]

Cheng C M, Wei Y C, Xu J J, et al.

Remote sensing estimation of chlorophyll a and suspended sediment concentration in turbid water based on spectral separation

Optik, 2013,124(24):6815-6819.

DOI:10.1016/j.ijleo.2013.05.078      URL     [本文引用: 1]

Chlorophyll a and suspended sediment are important indicators of water quality, and remote sensing estimation of them is difficult due to the optical complexity of turbid water. The spectrum above water surface is influenced by phytoplankton, suspended sediment and colored dissolved organic material in water, thus spectral separation is important before estimating one specific component. Based on the field experiment of pond water and Taihu lake, China, this study calculated the Gaussian parameters of Chlorophyll a (Chla) and suspended sediment (SS) through spectral decomposition, and then these parameters were used to separate the mixed spectrum of water samples from pond water and Taihu lake. After spectral separation, the Chla estimation model based on the peak height at 650 nm has high accuracy (R2 = 0.78, RMSE = 4.80 mg/m3), better than the band-ratio model; the SS estimation model based on the peak height at 811 nm (R2 = 0.82, RMSE = 6.80 mg/L) performs better than the single-band model. Results in this study indicate that spectral separation based on Gaussian parameters is a good method for Chla and SS estimation in turbid lake water. 2013 Elsevier GmbH.

梁栋, 杨勤英, 黄文江, .

基于小波变换与支持向量机回归的冬小麦叶面积指数估算

红外与激光工程, 2015,44(1):335-340.

URL     [本文引用: 1]

R2)明显高于冠层反射率的回归确定系数;利用小波系数与LAI 建立的SVR 模型的反演精度最高,模型实测值与预测值的检验精度(R2)为0.86,均方根误差(RMSE)为0.43;而常用植被指数(归一化植被指数,NDVI;比值植被指数,RVI)建立的估测模型对冬小麦多个生育时期LAI 反演精度最低(R2 <0.76,RMSE>0.56)。因此利用连续小波变换进行数据预处理,能更好地筛选出对叶面积指数敏感的信息,LAI 回归方法比较结果表明,SVR 比PLS 更适合于LAI 的估测,通过将CWT 与SVR 结合(CWT-SVR)能实现不同生育时期冬小麦叶面积指数的遥感估算。]]>

贺佳, 刘冰峰, 郭燕, .

冬小麦生物量高光谱遥感监测模型研究

植物营养与肥料学报, 2017,23(2):313-323.

[本文引用: 1]

贾学勤, 冯美臣, 杨武德, .

基于多植被指数组合的冬小麦地上干生物量高光谱估测

生态学杂志, 2018,37(2):424-429.

[本文引用: 1]

/