服务热线:
86-0755-23229824
您当前所在位置: 首页>>应用案例>>农业环境
高光谱成像技术鉴别菠菜叶片农药残留种类

image.png

0  言

菠菜是我国普遍栽培的品种,为极常见的蔬菜之一,以其鲜、嫩的品质以及较高的营养价值,深受广大消费者喜爱,市场需求量大且较容易种植,具有很好的经济价值。在菠菜的生长过程中,有的农户为保证其免受各种病虫害影响,会使用多种农药或杀虫剂,农药大部分都残留在菠菜叶子上,即使采取专业的清洗也难以消除其表面的农药。更可怕的是有些农户在刚打完药后没多久就采摘进行销售,这样就会进一步增加农药残留的量,长期食用含有农药残留的蔬菜,会诱发各种疾病,甚至可能导致癌症和基因突变。菠菜中的农药残留是否达标是评判菠菜质量的关键因素之一,而农药残留检测中鉴别有无农药残留及农药残留的种类是农药残留检测的前提。果蔬表面的农药残留检测有许多成熟可行的方法,例如: 气相色谱法和高效液相色谱法,但这些方法有检测时间长、需要依赖化学试剂、对样品有一定的损坏、操作复杂等缺点。

image.png

研究表明,高光谱成像技术被广泛用于农产品品质检测,但将高光谱成像技术结合特征选择算法和多种分类建模算法用于菠菜叶片表面多种类农药鉴别的研究未见报道。本文以不含农药的菠菜叶片及分别含有常用4 种农药( 菊酯、乐果、灭多威、辛硫磷) 残留的菠菜叶片为研究对象,利用高光谱成像技术、光谱预处理技术、主成分分析技术、卡方检验特征提取算法和分类机器学习算法对菠菜叶片农药残留种类鉴别进行研究,并结合 10 折交叉验证技术选择出了最佳特征波段和分类模型,减少了模型的运行时间,实现了快捷无损识别出菠菜叶片上的农药残留种类。

1 

1.1材 

实验用的菠菜购于北京某批发市场,实验农药为: 氯氰菊酯、乐果、灭多威和辛硫磷。对乐果农药,用蒸馏水将其配置成 1 500 的溶液; 由于氯氰菊酯、灭多威和辛硫磷这 3 种农药难溶于水,所以用甲醇分别将其配置成 1 500 的溶液。甲醇作为一种溶解剂被添加进来,它可能会影响到含有农药叶片的真实光谱信息,但其作为背景因素对农药残留种类的判别影响很小。如图 1 为只喷洒甲醇的菠菜叶片的平均光谱曲线。把同浓度的农药和蒸馏水均匀喷洒到 125 个菠菜叶片表面,每种类喷洒 25 个叶片,将叶片放置 12 h 后晾干,采集高光谱图像。

image.png

 1 喷洒甲醇后菠菜叶片的平均光谱曲线

1.2 高光谱数据采集与校正

采集高光谱数据时,将样品放置于电动平移台上,为了得到清晰的图像需要多次的相机调焦和平台运动速度的调整,经过多次调试,最终确定平台的运动速度为 0. 3 cm/s,曝光时间 0. 08 s。采集到的高光谱成像数据为样品的光谱数据和图像数据组成的三维数据立方体,为了尽可能降低图像噪声和暗电流的影响,需要将采集的原始高光谱图像进行黑白校正,在采集高光谱数据时将相机对准白板采集的数据为 W,盖上 CCD 相机镜头采集的数据为 D,其校正公式为

image.png

式中: R 为校正后的高光谱图像; I 为原始高光谱图像; D 为全黑的标定图像; W 为全白的标定图像。校正的工具为高光谱系统自带的软件 Spec VIEW。后续所用到的分析软件包括: Matlab 2016b、Envi5. 1、IBM SPSS Statistics 22.0 和 python3.6。

2结果与讨论

2.1 样品光谱曲线分析

image.png

首先利用 Envi5.1 软件选取菠菜叶片上的感兴趣区域( Region of interest,ROI) ,为了充分利用每个菠菜样品同时增加模型训练样本数,每个菠菜叶片样品选取 4 个 ROI,ROI 的选取避开主茎干,选取 ROI 的位置如图 2 所示。ROI选取的像素点数为 50 个,计算出 ROI 内像素点光谱的平均值,以该平均值作为该样品其中的一条光谱记录,最后一共搜集到 500 条光谱曲线,每类样品100 条。为了清晰分辨出不同种类的样本之间的光谱信息差异,对每类样品 100 条光谱曲线求平均,平均光谱曲线如图 3 所示。从图 3 中可以看出,不同种类农药残留的菠菜叶片光谱反射率有一定的差异,与正常叶片不同,滴过农药的叶片的光谱反射率在某些波段明显低于正常叶片,而不同种类的农药残留叶片光谱反射率也有一定的差异。目前已有相关研究表明: 农药胁迫会导致植物的某些生理生化指标( 如植物内部的组织形态、叶绿素、可溶性多糖等) 发生改变,这些改变将会影响近红外波段的植被反射率,所以可以利用光谱信息来判别菠菜是否有农药残留及残留农药的种类。

image.png

 3 无残留和不同种类农药残留菠菜叶片表面 ROI 平均光谱曲线

 

2.2 菠菜叶片 ROI 光谱信息预处理

在菠菜叶片高光谱数据的采集过程中,所测样品的色泽差异、叶片表面的不平整性、叶片的水分含量以及质地不完全相同等因素可能会引起样品发生散射现象进而掩盖与农药相关的光谱信息。农药残留分析属于痕量分析的一种,因此由于散射所引起的光谱差异可能会大于农药种类不同所引起的光谱差异,所以需要用多元散射校正算法( Multiplicative scatter correction,MSC) 对原始光谱曲线进行校正,MSC 可以消除漫反射光谱的基线漂移,对样品不均匀性造成的噪声也有较好的效果,经过散射校正后能最大程度消除光谱散射的影响。校正前后光谱曲线的对比如图 4所示。

image.png

 4 原始光谱曲线( a) 和 MSC 校正后的光谱曲线( b)

2.3 基于主成分投影的样品识别

主成分分析 ( Principal components analysis,PCA) 是通过线性数据转换的方法提取最重要的信息,从而降低数据的维度,被广泛应用于高光谱数据降维和分析中。在本文中,利用 PCA 对不同菠菜样品的光谱数据进行可视化判别,如图5 所示,前两个主成分的累计贡献率达到了 96. 5% ,故用前 2 个主成分能较好地表示出原来的高维光谱数据,从图中可以看出在经过多元散射校正后不同种类菠菜样品光谱数据分布差异明显,因此,PCA 可以更直观地对五类菠菜样品进行定性识别。但 PCA 是无监督算法,它分析出来的结果只和样品的光谱数据有关而和样品的类别无关,那些贡献率小的主成分对于叶片残留农药种类的鉴别也可能很重要,经过 PCA 降维后的数据也失去了原数据的意义,不适合用于日后在线分析检测的研制。综上,有必要使用有监督的学习算法对其进行研究。

image.png

5 含有不同种类农药残留菠菜样品的高光谱数据 PCA 分析

 

2.4 最佳波段和分类模型

本研究中需要处理的菠菜叶片的高光谱图像的特征维数高达 256 维,有必要对其进行特征选择以剔除冗余的特征,从而减少模型的运行时间,为日后在线检测设备的研制提供便利。为了选择出最优的特征波长子集和分类预测模型,本文尝试了统计学上的卡方检验特征选择方法并结合常用的4 种 机 器 学 习 分 类 算 法,分 别 为: 支 持 向 量 机( Support vector machine,SVM) 、朴素贝叶斯模型( Naive bayesian model,NBM) 、决策树( Decision tree)和线性判别分析( Linear discriminant analysis,LDA) 。卡方检验( Chi-squared test) 是分类问题常用的特征选择方法之一,该方法采用了统计学上的卡方检验,需要计算并排序各维特征与类别间的相关程度,然后只保留最相关的 k 维特征,k 可由程序设定。为了增加模型的稳定性,采用了 10 折交叉验证的方法对样本进行划分训练集和测试集,取 10 次交叉验证预测准确率的平均值和标准差对模型进行评估。如图6中实心浅蓝线和实心红线所示,红线的长度代表标准差的大小,标准差为 0 时红线消失,结合模型的预测准确率和选择的波长个数,蓝色虚线画出了各个模型的最优参与分类的特征个数占总特征个数的百分比,具体的波长选择结果及模型的预测性能如表 1 所示。

image.png

 6 卡方检验结合不同分类模型预测结果示意图。( a) 卡方检验结合支持向量机; ( b) 卡方检验结合朴素贝叶斯; ( c)卡方检验结合线性判别分析; ( d) 卡方检验结合决策树。

: 图中横坐标为卡方检验筛选出的变量个数百分比,纵坐标为该模型预测的准确率。

 1 波长的选择结果及模型的预测性能

image.png

从表 1 的分析可以得出,Chi-squared test 结合 LDA 的判别模型相比其他模型选出的特征子集的个数最少,选择波长的范围为 1 439.3 ~1 462 nm共 8 个波长,分别为: 1 439.3,1 442. 5,1 445.8,1 449,1 452.3,1 455.5,1 458.7,1 462nm,预测的准确率达到 0.993,预测准确率的标准差 为 0.009,故 可 认 为 Chi-squared test 结 合LDA 的判别模型为判别菠菜叶片上的农药残留种类的最佳模型。

3  论

基于高光谱成像系统利用 PCA 对菠菜叶片上的农药残留种类进行可视化的判别分析,结果表明 PCA 可以直观地对菠菜叶片上的农药残留种类进行定性识别。PCA 虽然有比较直观的优点,但对本研究也有不利的地方,基于此,采用了Chi-squared test 结合常用的 4 种分类建模算法筛选出了最佳波段和最优的 LDA 判别模型。筛选出的 8 个特征波长为: 1 439. 3,1 442. 5,1 445. 8,1 449,1 452. 3,1 455. 5,1 458. 7,1 462 nm,缩短了模型的运行时间。将这 8 个特征波长代入 LDA模型结合 10 折交叉验证技术,预测准确率达到0. 993 且 10 次交叉验证的标准差为 0. 009。本研究中,从将准备好的样品送进实验室开始到检测结束,平均每个样品花费时间 2 min 左右,未来可考虑将实验流程实现自动化从而进一步提高检测效率。本研究可基于高光谱成像技术、光谱预处理多元散射校正技术、Chi-squared test 特征选择算法和分类建模算法准确鉴别出菠菜叶片表面的农药残留种类,为菠菜叶片的农药残留种类在线检测提供了参考。


Copyright © 2020 All Rights Reserved 莱森光学(深圳) 有限公司·版权所有 备案号:粤ICP备18141551号