服务热线:
86-0755-23229824
您当前所在位置:首页>>光学知识
高光谱图像特征提取方法综述

高光谱遥感技术具有能同时反映遥感对象空间特征和光谱特征等独特优势,但这些优势也带来了波段众多 且相关性强、数据冗余度高、不利于进一步处理与利用等问题。 通过降维可以减少数据中的冗余信息,提高处理效率, 而特征提取作为降维的一种重要方法,具有降维速度快等优点。 因此,特征提取对高光谱图像的利用有重要意义。

1、高光谱图像降维基本原理

高光谱图像降维方法可分为基于特征提取( Fea- ture Extraction)的方法和基于特征选择( Feature Selec- tion)的方法两类] 。高光谱图像特征选择又称波段选择,波段选择的 定义是从一组数量为 K 的原始特征中,按照令准则函 数 JX)最大的原则,选择出数量为 kk < K)的一组特征 X,如图 2 所示。波段选择降维方法又可分为两类:一类是基于信息量的波段选择方法,例如熵与联合熵 的方法、最佳指数法(OIF)、自适应波段选择法等;另 一类是基于类间可分性的波段选择方法,例如时空维方法与光谱维方法等。

1663904313118129.png 

1 高光谱图像示意图

1663904319989318.png

2波段选择过程

1663904325603370.png 

3特征提取过程

高光谱图像特征提取,即将原始高光谱数据从高维光谱特征空间按照某一变换方式,投影到一个维数更低的子空间。特征提取过程如图3所示,其中FX1X5表示一个线性或者非线性的变换方程。

波段选择受搜索算法和准则函数的影响,不可避免地会损失大量信息,而特征提取方法可以经过变 换直接将高维数据降维到目标维数,降维速度快。

2、高光谱图像特征提取研究现状

特征提取方法可分为传统机器学习方法以及深度 学习方法两类,如图 4 所示。其中,传统机器学习方法 根据特征空间映射函数的形式又可分为线性方法和非线性方法。

1663904385154981.png

4 高光谱特征提取方法分类

2.1传统机器学习方法

2.1.1线性方法

假设高维数据采样于线性结构中,并通过一个线性形式的变换实现高光谱图像特征提取。根据利用样本类别信息的情况,线性方法可进一步细分为无监督、有监督及半监督学习3种学习方法。其中,数据集中只有部分样本含有类别标签,同时使用有标记和无标记样本实现降维的算法属于半监督学习方法。因为半监督方法的相关研究较少,所以本文着重对无监督和有监督方法进行介绍。

1)无监督方法。

数据集不包含类别标签,只利用无标记样本实现降维的算法属于无监督学习方法。

2)有监督方法。

利用含有标签信息的标记样本实现降维的算法属于有监督方法,线性判别分析(LDA)等即为有监督特征提取算法。

2.1.2非线性方法

虽然线性方法普遍具有理论成熟、原理简单、便于实现和使用等优点,但高光谱数据属于非线性数据,利用线性方法对高光谱图像数据进行维数约减往往无法取得满意的效果。

1)核方法

核方法的主要思想是:在原始低维空间中无法线性划分的数据,利用核函数将其投影到高维希尔伯特空间中线性可分,最后对变换后的数据进行降维。核方法的优点是有效解决了非线性数据线性不可分的问题,且计算量并没有随着维度的升高而显著增加。

2)流形学习。

流形学习假设高维数据采样于一个低维流形中,通过学习高维数据内蕴的几何结构,求解数据的低维坐标及对应的映射,从而实现对高维数据的降维或可视化。

2.2深度学习方法

深度学习是机器学习领域的分支之一,旨在构造一个可训练的深层模型仿效人脑分析和处理问题的过程。高光谱图像多种多样,一种特征提取方法很难在所有类型的数据中均取得良好的效果,这是传统机器学习方法普遍存在的问题。深度学习方法很好地解决了这个问题,针对不同类型的数据学习特征,深度学习模型可以根据不同的数据自主地学习特征。

3、高光谱图像特征提取存在的问题与研究方向

3.1存在的问题

高光谱图像特征提取技术作为一种预处理技术,减少了数据中的冗余信息,提高了目标检测、分类等后续应用的效果,极大地促进了高光谱遥感技术的发展。但目前的特征提取技术及算法还存在很多局限性,主要表现在以下几个方面。

1)有些高光谱特征提取算法时间复杂度过高、运算时间过长,即使精度有一定提高也得不偿失,不适于某些对算法实时性要求很高的场合。

2)许多高光谱特征提取算法都含有参数,对于算法的使用者而言,调参是一个耗时费力的过程,且参数的取值对算法的效果有显著影响,所以最佳参数的选择是一个难以解决的问题。

3)高光谱图像提供了丰富的空间、光谱信息,但目前绝大多数特征提取算法都只利用了高光谱图像的光谱信息,如何高效地综合利用高光谱图像的空间、光谱信息是有待进一步深入研究的问题。

3.2研究方向

针对高光谱图像特征提取方法的研究现状及存在的问题,提出了一些解决问题的思路及有价值的研究方向。

1)利用SparkCUDA并行编程框架实现诸如流形学习等时间复杂度较高算法的并行化,可以有效缩短算法的运行时间。

2)完善特征提取算法的理论体系,为解决目前存在的问题提供理论依据,例如为核方法中核函数以及核参数的选择提供理论依据。

3)在对高光谱图像数据进行特征提取之前对高光谱图像进行空间滤波,从而综合利用高光谱图像的空间信息及光谱信息。

4)在实际应用中,对高光谱图像数据进行标记的成本较高且有些数据无法进行标记,所以无监督或半监督特征提取算法是后续研究的重点。5) 深度学习作为目前机器学习领域最热门的研究方向,具有许多传统机器学习方法所不具备的独特优势,基于深度学习的高光谱特征提取方法是一个极具价值的研究方向。

1663904403262664.png


Copyright © 2020 All Rights Reserved 莱森光学(深圳) 有限公司·版权所有 备案号:粤ICP备18141551号-1