服务热线:
86-0755-23229824
您当前所在位置: 首页>>应用案例>>农业环境
基于高光谱技术检测香水梨硬度的研究

基于高光谱技术检测香水梨硬度的研究

香水梨又名软儿梨,属于秋子梨的一个品种,主要分布于甘肃、宁夏境内。在宁夏海原地区,香水梨是当地农民的主要收入来源,近年来种植面积不断扩大,然而目前仍存在很多技术上的问题需要解决。硬度作为梨果的一个重要参数,与香水梨的成熟度,口感,食用性息息相关,传统的检测方法具有明显的破坏性,不适用于大规模量产的地区,因此利用光谱学技术建立一种香水梨的硬度检测方法显得尤为重要。高光谱技术作为一种高效、快速、无损的检测技术,目前已广泛应用于水果内部指标的检测。因此,结合当地需求,本文通过对光谱数据进行 4 种预处理方法,3 种特征波长的提取方法处理后,选择一种最优模型来预测香水梨硬度。


一、材料与方法

1.1  样品采集

实验样品全部来自于宁夏回族自治区海原县方堡村,样品自采摘后于 24 h 内运输至宁夏大学,在宁夏大学冷库内进行保存,贮藏温度 0 ~ 2 ℃。样品测试前需将样品从冷库取出,放置在 20 ℃恒温条件下 24 h,待样品中心温度恢复至 20 ℃开始检测。

①光谱采集仪器。Hyper Spec VIS/NIR 高光谱成像系统,光谱范围为 400 ~ 1000 nm 和 125 波段的超高光谱影像可见 / 近红外光谱仪系统。包括 v10e-qe 高光谱影像光谱仪、C8484-05G-CCD- 相机、90-254vac 线性光源、Dcrih 卤素灯、传输装置、计算机和数据采集软件。②硬度检测。硬度计HLY-YD5。③数据处理软件。ENVI5.3,The Unscrambler  X  10.4,MATLAB R2014a。以上软、硬件由宁夏大学提供。


二、结果与分析

2.1 PLSR初模型的建立及评价方法

偏最小二乘回归(PLSR)是一种多元回归方法,用于建立分析样品光谱响应与参考值之间的验证模型。相对于其他模型直接考虑因变量和自变量而建立回归模型的方法,PLSR 则是重新过滤信息,选择最佳变量,再对筛选出的变量进行建模。因此,其筛选出的光谱值决定了建模成功率的高低。一般来说,评价 PLSR 模型成功率的指标有 3 个:预测样本集的标准差(RMSEP)、校正集的均方根误差(RMSEC)、决定系数(R2)。一般情况下,R2值越大,RMSEP 和 RMSEC 越小,表明模型的预测能力越强。使用 ENVI5.3 提取香水梨样本的感兴趣区域(Region Of Interesting,ROI)感兴趣区域必须具有一定的代表性,可以代表香水梨样品的硬度指标。为了获得具有代表性的光谱值,在选取 ROI 时要尽量避免过于灰暗的部分,选择香水梨整体光量部分,记录每个样本 ROI 的平均光谱。将每个样品提取出的光谱值和硬度数据导入至 The Unscrambler X 10.4,选择 PLSR 进行初步的模型建立。初始模型效果如图 1 所示。


由图 1 可知,样品初始模型效果不佳,数据点不连续,R2值为 0.782。因此,需要对光谱进行处理后,达到降噪均匀优化光谱的目的,再进行 PLSR 预测模型。


2.2  预处理方法的选择

采集到的光谱图像由于光源强度不均匀及噪音等因素的影响,可能在某种程度上会存在基线漂移等现象,为了提取出有效的光谱信号,消除光源强度不均匀的问题,需要对原始光谱数据进行预处理,为后续的光谱数据处理提供更加具有代表性的光谱区域。本文采用以下几种方法进行预处理。


2.2.1  卷积平滑法

卷积平滑(Savitzky-Golay ,S-G)是一种对光谱进行平滑处理的方式,主要包括移动平均法、高斯滤波法、中值滤波法和 S-G 卷积平滑法。


2.2.2  归一化法

归一化(Normaliaze)是一种行式转换算法,适用于光谱信号与样品函数关系的分析,或者利用其他光谱值代替样品检测值的方法。通过计算机变换,最终使光谱数据在同一范围内,变量和均值的分布更加均匀。


2.2.3  标准正态变换法

标准正态变换(Standard Normal Variate,SNV)是一种通过样品的方差对光谱进行校正的方法,SNV 可以有效的消除光源强度不一、散射噪声等检测时出现的干扰,通过线性变换对初始光谱数据标准化进行校正,减小样本因为表面散射、光谱迁移等因素带来的误差。经过上述预处理后模型结果如表 1 所示,归一化法拥有较小的 CV 值和较大的 R2值,表明其对结果的预测效果较好,因此后续的特征光谱提取均采用归一化法作为光谱的预处理方法。



2.3 特征波长的提取

2.3.1 竞争性自适应加权算法

竞争性自适应加权算法(CARs)是模仿“适者生存”理论而提出的特征变量选择算法。CARs 算法的核心是首先采用自适应重加权采样技术,优选出 PLSR 模型中绝对值大的回归系数所对应的波长变量点,然后借助指数衰减函数,最后将 RMSECV 最小的子集定义为最优变量子集。使用 Matlab运行 CARs 程序多次后,选择CV值最小的波长组作为特征波长,一共12条,将12条特征波长导入Unscrambler 后建模得到模型如图2所示,其RMSEC值为0.659,R2为 0.764。

2.3.2  区间变量迭代空间收缩法

区间变量迭代空间收缩法(i VISSA)的主旨思想是选择最优区间,然后根据最优选区间再进行建模,该算法来自于VISSA 算法,之后结合全局和局部搜索,智能地优化波长的宽度、组合及间隔。在局部搜索上,i VISSA 算法使用光谱数据的连续性信息来确定波长间隔的宽度,在全局搜索上,主要搜索信息波长的组合和位置。最终用迭代的方式优化光谱间的数据间隔,确定光谱的组合、位置以及宽度。使用 Matlab 运行 i VISSA 程序多次后,选择 CV 值最小的波长组作为特征波长,一共 66 条,将 66 条特征波长导入Unscrambler 后建模得到模型如图3所示 , 其 RMSEC 值为0.666,R2为 0.760。

2.3.3  变量组合集群分析法

变量组合集群分析(VCPA)是一种新兴的特征变量识别算法,该方法的特点是充分考虑了变量集之间可能存在的影响。方法的计算原理是,首先通过利用二进制矩阵采样法对样本空间进行重采样,之后将数据随机划分为若干子集,针对子集分别建立子模型,最后对子模型一一进行评价。一般情况下,VCPA 算法计算过程如下:①先利用二进制矩阵采样法,对样本变量进行采样,选取目标函数 CV 值最小的变量子集;②计算每个波长点对应的化学值或者实测值,在本次迭代计算过程中出现的概率;③通过衰减函数筛选出概率较小的波长范围或者波长点,达到缩小变量集空间的目的;④最后将保留的变量重复上述过程将剩余变量进行组合,最终得到特征波长变量。使用 Matlab 运行 VCPA 程序多次后,选择 CV 值最小的波长组作为特征波长,共 10 条,将 10 条特征波长导入Unscrambler 后建模得到模型如图4所示,其 RMSEC 值为0.351,R2为 0.933。

三、结论

对香水梨硬度原始光谱进行了 3 种预处理后,选择归一化法为最佳方法,以此作为基础光谱,对比 3 个特征波长建模后的 PLSR 模型效果,最终选择 VCPA 法,其提取特征波长10个,建立的 PLSR 模型优于初始模型,R2=0.933,可以用作一种快速检测香水梨硬度的方法。

Copyright © 2020 All Rights Reserved 莱森光学(深圳) 有限公司·版权所有 备案号:粤ICP备18141551号-1