海洋科学  2023, Vol. 47 Issue (5): 102-112   PDF    
http://dx.doi.org/10.11759/hykx20220626001

文章信息

盛辉, 韦靖靖, 胡耀东, 许明明, 崔建勇, 郑红霞. 2023.
SHENG Hui, WEI Jing-jing, HU Yao-dong, XU Ming-ming, CUI Jian-yong, ZHENG Hong-xia. 2023.
基于多时相Sentinel-2影像多特征优选的湿地信息提取
Wetland information extraction based on multifeature optimization of multitemporal Sentinel-2 images
海洋科学, 47(5): 102-112
Marine Sciences, 47(5): 102-112.
http://dx.doi.org/10.11759/hykx20220626001

文章历史

收稿日期:2022-06-26
修回日期:2022-08-03
基于多时相Sentinel-2影像多特征优选的湿地信息提取
盛辉1, 韦靖靖1, 胡耀东2, 许明明1, 崔建勇1, 郑红霞1     
1. 中国石油大学(华东)海洋与空间信息学院, 山东 青岛 266580;
2. 青岛市勘察测绘研究院, 山东 青岛 266033
摘要:本文提出了一种随机森林(random forest, RF)模型和Pearson相关系数相结合的RF-Pearson模型特征优选方法。以多时相Sentinel-2影像为数据源, 提取多时相多特征; 利用RF-Pearson模型进行特征选择, 筛选出特征重要性得分较高且相关性较小的特征作为优选特征, 参与黄河三角洲湿地信息提取; 最后将分类结果与多时相全特征和随机森林模型优选特征进行比较。实验表明: 特征优选能够提高湿地信息的提取效果, 基于RF-Pearson模型特征优选方法的分类精度最高, 表明了特征优选方法的有效性以及特征优选在湿地分类方面的优势。
关键词黄河三角洲    多时相    特征优选    Pearson    
Wetland information extraction based on multifeature optimization of multitemporal Sentinel-2 images
SHENG Hui1, WEI Jing-jing1, HU Yao-dong2, XU Ming-ming1, CUI Jian-yong1, ZHENG Hong-xia1     
1. College of Oceanography and Space Information, China University of Petroleum (East China), Qingdao 266580, China;
2. Qingdao Municipal Institute of Surveying and Mapping, Qingdao 266033, China
Abstract: This paper presents a method for feature optimization of the RF-Pearson model based on the combination of the random forest model and Pearson correlation coefficient. The multitemporal Sentinel-2 image was used as the data source for extracting multitemporal features. Furthermore, the RF-Pearson model for feature selection was employed to select the features with a high importance score and low correlation of feature variables as the preferred features, participating in the wetland information extraction in the Yellow River Delta. Finally, the classification results were compared with multitemporal full and random forest model optimization features. Experiments revealed that feature optimization can enhance the extraction effect of wetland information, and the feature optimization method based on the RF-Pearson model had the highest classification accuracy, indicating the efficacy of the feature optimization method and the benefits of feature optimization in wetland classification.
Key words: Yellow River Delta    multitemporal    feature optimization    Pearson    

黄河流域在中国生态安全、经济发展和文化繁荣等方面具有十分重要的地位, 黄河三角洲自然资源丰富, 是带动东部沿海地区产业结构调整和发展方式的重大引擎, 因此统筹各项任务、科学谋划、明确用力方向, 对推进区域经济跨越发展具有重要意义。湿地是地球上生产力最高的生态系统, 然而, 由于经济快速度发展、人口不断增加, 工农业较为发达, 人类活动越来越剧烈, 黄河三角洲地区在过去几十年经历了快速的土地覆盖变化[1-2]。为了保护黄河三角洲区域的生态环境, 协调区域生态多样性, 制定了各项生态环境保护条例, 统筹规划了该区域今后的发展方向, 坚持以生态的方式治理生态。因此, 需要采用快速科学的方法, 对黄河三角洲湿地信息进行准确提取, 湿地信息的准确提取为黄河三角洲区域生态环境保护条例的科学制定奠定了基础。

随着遥感技术和图像处理技能的快速发展, 利用遥感影像进行土地覆盖研究成为主流。目前, 有众多学者利用遥感数据的单一时相, 对湿地信息提取进行了研究[3-5]。但是, 湿地信息具有季相特点且湿地地物分布错综复杂, 仅靠单一时期数据对湿地信息进行分类, 缺乏季节性相关的湿地特征, 容易造成地物的混淆, 所以, 近几年利用多时相遥感数据进行湿地信息提取的研究得到了发展[6-7]。还有一部分学者, 利用提取湿地地物的特征信息(如, 相植被、水体和纹理特征等)来改善湿地分类效果, 通过特征提取增加了地物间的差异特征, 对湿地信息提取精度有一定的提高[8-10]。充分利用特征信息, 可以提取多种类型的特征, 但多种特征会带来“维数”灾难, 造成数据冗余, 不仅分类的执行效率大打折扣, 而且影响湿地信息提取的效果, 势必要对特征进行优选, 基于传统的特征优选方法[11-13], 只考虑了特征之间的单一关系, 随机森林模型特征优选只考虑特征在分类中的贡献值, 缺乏特征之间的相关性分析, 使得筛选出的特征重要性得分高, 但特征之间的相关性较大, 导致数据冗余, 影响分类效果, 所以, 特征优选既要充分利用重要性高的湿地特征, 又要减小特征之间的数据冗余, 保证湿地信息的提取效果。

本文以黄河三角洲湿地作为研究区域, 以多时相Sentinel-2影像为数据源, 挖掘多种时相特征, 提出一种随机森林模型和Pearson系数相结合的特征优选方法, 获得最优特征组合; 分析多时相优选特征对黄河三角洲湿地信息提取的优劣, 为湿地信息的准确提取提供依据。

1 特征优选算法原理 1.1 基于传统的RF模型特征优选

随机森林分类器在每次建立随机森林决策树抽样的过程中, 约有1/3的样本数据未被抽取, 未被抽取的数据被称为袋外数据(out of bag, OOB)。通过袋外数据产生的袋外误差, 能够计算参与分类特征的重要性得分, 选择重要性得分高的特征, 从而达到特征优选的目的[14]。假设随机森林中有N棵树, 对每一颗决策树, 选择相应的袋外数据计算袋外误差E1, 随机对袋外数据OOB所有样本的特征加入噪声干扰, 再次计算袋外数据误差E2, 特征x的重要性记为X, 则X的计算公式为:

$ X = \frac{1}{N}\sum {_{i = 1}^N\left( {{E_2} - {E_1}} \right)} . $ (1)

传统的RF模型选择的特征, 只考虑了特征对分类的相对重要性, 通过获取重要性得分高的特征达到特征优选的目的, 但重要性得分高的特征之间也存在数据冗余, 所以, 传统的RF模型缺乏特征之间的相关性运算。

1.2 基于RF-Pearson模型特征优选

本文采用随机森林模型和皮尔逊相关系数相结合的RF-Pearson模型进行特征优选, 既能获得贡献值高的特征, 又能减少特征之间的相关性。

皮尔逊(Pearson)相关系数描述一种线性关系, 包括是否相关、正相关、负相关和相关的紧密程度。可以通过相关系数值来判断两个变量XY之间的相关关系, 数值介于−1和1之间, 数值的绝对值大小与相关强度成正比。变量XY的相关系数r的计算公式为:

$ r = \frac{{\sum {_{i = 1}^n\left( {{X_i} - \bar X} \right)\left( {{Y_i} - \bar Y} \right)} }}{{\sqrt {\sum {_{i = 1}^n{{\left( {{X_i} - \bar X} \right)}^2}} \sqrt {\sum {_{i = 1}^n{{\left( {{Y_i} - \bar Y} \right)}^2}} } } }} . $ (2)

式中, r代表相关系数, n表示样本数量, XiYi是变量XY对应的i点观测值, $\bar X$$\bar Y$表示随机变量XY样本平均数。

首先, 通过传统的随机森林模型评估每个特征在分类中的重要性, 再利用Pearson相关系数计算特征之间的相关性, 筛选出特征重要性得分较高且相关性较小的特征作为优选特征, 既能获得贡献值高的特征, 又能减数据冗余, 进而提高湿地信息提取效果。

2 实验方法 2.1 研究区概况

黄河三角洲位于山东省东北部, 地处渤海之滨, 主要分布于东营市和滨州市境内, 面积广阔。黄河三角洲是典型的河口湿地生态系统, 是保护物种多样性的天然基因库, 因此选择该区域进行地物覆盖类型研究, 研究区域如图 1所示。

图 1 研究区 Fig. 1 Research area
2.2 实验数据的筛选及预处理

Sentinel-2拥有多光谱成像设备, 能够检测到土地覆盖信息, 包括植被覆盖、生长状况、土地环境和河流环境等信息, 这对监测土地环境具有重要意义, 特别是Sentinel-2红边指数更适于作物生物量的监测[15], 对植被监测十分有效。Sentinel-2进入运行状态后, 地球赤道区域的完整测绘需要5 d, 而纬度较高的区域, 完整测绘一次仅需要3 d。

本文选用2018年黄河三角洲的Sentinel-2影像。首先, 对影像质量和云量条件初步筛选, 再选出具有季节代表的2幅影像, 使得选取的遥感影像能够获得更多的时相信息。选取对信息提取有用的10个波段, 去除无用波段, 减少数据冗余, 影像具体信息和选取的波段信息如表 1表 2所示。

表 1 Sentinel-2数据信息 Tab. 1 Sentinel-2 data information
卫星名称 波段数 获取时间 代表季节 云量 空间分辨率/m
Sentinel-2 10 2018-09-09 < 10% 10/20/60
Sentinel-2 10 2018-12-18 < 10% 10/20/60

表 2 Sentinel-2波段参数 Tab. 2 Sentinel-2 band parameters
波段 中心波长/nm 波谱宽度/nm 分辨率/m
B2(蓝色波段) 490 65 10
B3(绿色波段) 560 35 10
B4(红色波段) 665 30 10
B5(红边波段1) 705 15 20
B6(红边波段2) 740 15 20
B7(红边波段3) 783 20 20
B8(近红外波段1) 842 115 10
B8a(红边波段4) 865 20 20
B11(短波红外波段1) 1 610 90 20
B12(短波红外波段2) 2 190 180 20

从欧洲航空航天局可以直接获得L1C级的Sentinel-2数据, L1C级的数据已经经过欧洲航空航天局初步处理, 再对获得的数据进行辐射定标和大气校正, 该数据的大气校正需要在ESA提供的SNAP软件中完成, 对L1C级数据处理后获得的是L2A级产品。

考虑到Sentinel-2数据波段较多且空间分辨率相差较大, 选用波段的空间分辨率大部分是20 m, 小部分是10 m, 如表 2所示, 所以要对空间分辨率进行灰度值重采样, 使波段空间分辨率统一到10 m。在重采样方法中, 双线性插值法虽然计算过程复杂且消耗大量的计算时间, 但能解决灰度值不连续的缺点, 效果较好, 并且图像质量高。

2.3 湿地分类方案

为了科学、准确地对实验区域进行分类研究, 本文根据实地勘测解译资料和中国滨海湿地分类系统以及相关文献资料[16], 制定的类别体系见表 3。本研究区域中有10种土地覆盖类型: 河流、潮滩、盐地碱蓬、互花米草、芦苇、天然柳林、柽柳林、互花米草、耕地和坑塘。

表 3 研究区分类体系 Tab. 3 Classification System of the study area
类别 类型 类型说明
自然湿地 河流 由一定区域内地表水和地下水补给, 经常或间歇地沿着狭长凹地流动的淡水水体
潮滩 沿海大潮高潮位与低潮位之间的潮侵地带
盐地碱蓬 一年生草本, 一般生于海滨、荒漠低处的盐碱荒地上, 典型的盐碱地指示植物
互花米草 多年生草本植物, 适宜生活于潮间带, 秸秆密集粗壮、地下根茎发达
芦苇 多年水生或湿生的高大禾草, 生长在灌溉沟渠旁和河堤沼泽地等
天然柳林 乔木, 广生态幅植物, 对环境的适应性很广, 较耐旱和耐盐碱
柽柳林 乔木, 喜生于河流冲积平原, 海滨、滩头、潮湿盐碱地和沙荒地
人工湿地 养殖池塘 人工修建或利用自然形成的养殖水生生物的池塘
耕地 人工开垦用于种植农作物的土地
坑塘 人工修建形成的蓄水区及常年水位以下的土地

本文的样本数据从收集的资料、现场实地踏勘数据和影像目视解译三个方面获得。收集的资料主要是2019年的地面实测数据; 2020年, 实验组对黄河三角洲自然保护区进行了详细的调研, 对不同湿地分布及其植被类型进行定位、记录并拍照; 依据2020年Google Earth影像进行目视解译, 本文研究区域位于黄河口自然保护区内, 人为活动稀少且土地受国家法律法规保护, 土地利用情况人为干预程度低, 地物类型在一定周期内变化较小。根据确定的土地覆盖类型, 在实验区域中均匀选取了10类地物样本, 分别是河流、潮滩、盐地碱蓬、互花米草、芦苇、天然柳林、柽柳林、互花米草、耕地和坑塘, 训练样本与验证样本之比约为7∶3, 样本如图 2所示。

图 2 研究区样本点的空间位置 Fig. 2 Spatial location of sample points in the study area
2.4 特征提取

为了充分利用湿地地物的特征信息, 以多时相光谱数据为基础, 提取多种类型的特征, 主要包括植被、水体、土壤、红边和纹理特征[17-18], 相关特征集的描述见表 4, 每幅影像共提取21个特征。

表 4 光谱指数描述 Tab. 4 Description of spectral index
指数名称 指数全称 变量 计算公式
NDVI normalized difference vegetation index BNIR (近红外波段)
BR (红色波段)
BB(蓝色波段)
BG(绿色波段)
BSWR1(短波红外波段1)
BRE1(红边波段1)
BRE2 (红边波段2)
BRE3(红边波段3)
(BNIRBR)/( BNIR+BR)
RVI ratio vegetation index BNIR/BR
DVI difference vegetation index BNIRBR
EVI enhanced vegetation index 2.5(BNIRBR)/(BNIR+6BR–7.5BB+1)
NDWI normalized difference water index (BGBNIR)/( BG+BNIR)
MNDWI modified normalized difference water index (BGBSWR1)/(BG+BSWR1)
LSWI land surface water index (BNIRBSWR1)/(BNIR+BSWR1)
SAVI soil adjusted vegetation index 1.5(BNIRBR)/(BNIR+BR+0.5)
NDI45 normalized difference index (BRE1BR)/(BRE1+BR)
MCARI modified chlorophyll absorption ratio index [(BRE1BR) –0.2(BRE1BG)] ×(BRE1BR)
PSSRI pigment specific simple ratio index BRE3/BR
NDre1 normalized difference red-edge 1 (BRE2BRE1)/(BRE2+BRE1)
NDre2 normalized difference red-edge 2 (BRE3BRE1)/(BRE3+BRE1)

实验选择Sentinel-2影像的原始波段作为光谱特征; 提取的植被特征有归一化植被指数(normalized difference vegetation Index, NDVI)、比值植被指数(ratio vegetation index, RVI)和差值植被指数(difference vegetation index, DVI)、增强型植被指数(enhanced vegetation index, EVI); 水体特征包括归一化水体指数(normalized difference water index, NDWI)、修改型归一化水体指数(modified normalized difference water index, MNDWI)和地表水体指数(land surface water index, LSWI); 土壤特征为土壤调节植被指数(soil adjusted vegetation index, SAVI); 红边波段是特别针对Sentinel-2而设计的, 利于植被信息提取, 通过红边波段生成的红边光谱特征指数包括4.5 μm波段归一化差异指数(normalized difference index for the 4.5 μm band, NDI45)、反射率修正型叶绿素吸收指数(modified chlorophyll absorption in reflectance index, MCARI)、植物衰老反射率指数(plant senescence reflectance index, PSSRI)、归一化红边差异指数1 (normalized difference red edge index 1, NDre1)和归一化红边差异指数2 (normalized difference red edge index 2, NDre2), 它们的计算见表 4

图像纹理特性的获取方法有很多种, 灰度共生矩阵(gray-level co-occurrence matrix, GLCM)是目前最常用的方法。灰度共生矩阵用二方位像素的共同概率密度系数来描述, 它不但反应了对比度的分配特性, 而且反应有同样明亮或相似明亮的像素间的分配特征, 是有关图形对比度变化的二阶统计特征。基于土地覆盖类型在图像空间上的纹理属性, 提取纹理特征, 反映感兴趣地物在图像空间上的相互作用关系。

主成分分析(PCA)是一种常用的波谱降维方法[19], 用主成分分析法实现遥感纹理特征的降维, 取主成分分后的第一主成分, 利用灰度共生矩阵法提取影像的8个特征: 角二阶矩(GLCM_A)、对比度(GLCM_Con)、相关性(GLCM_Cor)、差异性(GLCM_D)、熵(GLCM_E)、同质性(GLCM_H)、均值(GLCM_M)和方差(GLCM_V)。

2.5 分类器的选择

本文采用2种分类器, 随机森林(random forest, RF)和支持向量机(support vector machin, SVM)。比较不同分类器的实验结果, 可以消除分类器本身的局限性产生的影响, 保证信息提取结果更具有科学性。

随机森林算法[20]是由Breiman等人于2001年提出的一种非参数的集成算法, 将分类回归树(CART)作为基础分类器构建而成的集成分类器。在原始训练集中随机有放回的选择训练子集, 每个大小等于原始数据, 由多棵决策树对数据集进行预测, 形成随机森林预测, 对得到的预测分类结果进行投票决策确定类。实验结果证明, 如果假设决策树的数量是100, 则其信息提取结果最稳定, 因此将决策树的数目设置为100。

支持向量机算法是一种二分类模型, 将实例的特征向量(以二维为例)映射为空间中的一些点, SVM本质是利用“一条线”将空间中的点划分为两类, 两类点有各自的特征属性, “线”可以有很多条, 关键在于区分类的效果, 多条“线”可以将空间中的点划分为多类, 这些“线”还可用于回归或其他任务。

2.6 精度评价

为了证明所用方法的有效性, 本文采用视觉评估和分类性能进行评价。视觉评估用于检查明显的分类错误, 而从测试样本导出的混淆矩阵用于通过以下指标定量评估分类性能: 生产者精度(PA)、用户精度(UA)、总体精度(OA)和Kappa系数。

3 结果与评价 3.1 基于RF-Pearson模型的特征优选

本文的多时相原始光谱信息中包含较多的湿地季相差异特征, 保留差异特征更能充分利用时相信息, 因此, 只对提取的42个多时相特征进行优选。采用随机森林模型原始光谱信息和提取的特征进行重要性评估, 获得每个特征在分类中的重要性得分, 为了更直观地展示每个特征的重要性, 绘制了特征的重要性排序图, 如图 3所示。

图 3 特征重要性排序 Fig. 3 Feature importance ranking 注: B2_12表示为12月份波段B2, 以此类推

在特征重要性得分的基础上, 利用Pearson相关系数计算提取特征之间相关系数值, 找到Pearson相关系数值大于0.9的特征, 通过比较特征的重要性得分, 移除重要性得分较低的特征, 实现对提取的植被、水体、土壤、红边和纹理特征的降维, 42个特征经过RF-Pearson优选方法运算后, 获得23个特征作为优选特征, 获得的优选特征及其相关性如图 4所示。同时, 获取仅用传统RF模型获取重要性得分高的前23个特征, 作为对比实验。

图 4 优选特征及Pearson相关系数图 Fig. 4 Preferred characteristics and Pearson correlation coefficient diagram 注: DVI_9表示为9月份提取DVI植被指数, 以此类推
3.2 基于优选特征的可分性分析

本研究区域中有10种地物类型, 它们在不同特征上有不同的反射值, 为了更直观地描述地物在多时相优选特征上的可分性, 绘制地物在不同特征上的响应值。由于不同地物在同一特征上的反射值差异较大, 需要对地物反射值进行线性归一化处理, 然后绘制地物的特征曲线, 如图 5图 6所示。

图 5 多时相特征曲线 Fig. 5 Multitemporal characteristic curve 注: B2_9表示为9月份波段B2, 以此类推

图 6 优选特征曲线 Fig. 6 Optimal characteristic curve 注: DVI_9表示为9月份提取的DVI植被指数, 以此类推

图 5可以看出, 养殖池塘、坑塘、耕地和河流的可分性较高, 植被的可分性较低; 9月份, 芦苇、互花米草、天然柳林的特征曲线接近, 12月份, 潮滩和盐地碱蓬的特征曲线几乎重合, 芦苇、柽柳林和天然柳林的特征曲线变化一致且接近。从图 6可以看出, 利用纹理特征可以将互花米草分离; 盐地碱蓬在优选特征上的整体曲线差异大, 可分性较好; 芦苇、柽柳林和天然柳林的总体特征曲线接近, 在部分特征上表现出可分性。总体来看, 多时相原始光谱和优选特征能够形成优势互补, 在湿地的识别上有很大的优势。

3.3 信息提取结果与评价

为了准确科学地评价分类结果, 图 7展示了分类结果图, 表 5统计了各地物类型的分类精度, 可以得出:

图 7 信息提取结果图 Fig. 7 Information extraction result diagram 注: RF表示随机森林方法, RF-Pearson表示随机森林和皮尔逊相关系数相结合的方法, SVM表示支持向量机方法。

表 5 地物分类精度统计 Tab. 5 Accuracy statistics of feature classification
类别 多时相 多时相RF特征优选 多时相RF-Pearson特征优选 多时相全特征
RF SVM RF SVM RF SVM RF SVM
生产者精度/% 盐地碱蓬 89.18 82.28 93.14 80.37 93.32 81.64 85.70 80.72
柽柳林 77.64 57.90 79.85 52.72 81.73 54.94 78.96 48.64
耕地 99.22 96.97 99.20 95.95 99.85 99.17 100.00 98.97
互花米草 97.61 75.53 97.63 75.93 97.48 75.79 98.00 75.86
坑塘 96.25 84.29 96.55 84.80 96.89 84.27 96.26 84.20
芦苇 84.99 96.11 86.36 95.58 86.20 95.79 86.63 95.75
潮滩 88.11 97.60 90.96 97.70 92.22 97.40 90.33 97.06
河流 99.53 93.50 99.81 98.84 99.77 97.30 99.96 98.52
天然柳林 71.24 69.32 69.11 74.20 80.49 73.57 69.43 73.65
养殖池塘 75.58 82.28 79.25 84.88 80.28 85.02 79.52 84.40
用户精度/% 盐地碱蓬 90.87 66.50 88.01 67.28 91.99 69.50 88.67 69.05
柽柳林 79.64 50.11 82.28 46.67 82.26 45.97 80.65 43.30
耕地 93.60 98.61 98.13 98.64 96.65 98.54 96.16 98.11
互花米草 96.58 83.65 98.33 80.70 98.37 82.68 98.63 82.91
坑塘 96.46 84.27 96.91 84.92 97.11 84.76 96.68 84.71
芦苇 87.87 94.37 87.42 95.77 90.59 95.84 86.90 95.61
潮滩 78.55 94.54 85.55 96.84 84.90 96.95 85.02 96.49
河流 96.47 99.93 98.52 99.87 98.37 100.00 98.71 99.61
天然柳林 51.85 79.43 56.20 78.60 52.50 77.10 57.97 77.15
养殖池塘 86.43 66.50 84.33 83.91 86.83 82.54 84.76 81.34
总体精度/% 89.56 87.49 90.84 87.89 91.55 87.97 90.47 87.79
Kappa系数 0.871 0.843 0.887 0.849 0.895 0.850 0.882 0.848
注: RF表示随机森林方法, RF-Pearson表示随机森林和皮尔逊相关系数相结合的方法, SVM表示支持向量机方法。

1) 通过对图 7目视解译发现, 所有分类结果都存在一定的“椒盐”现象, 并且, 在所有的分类方案中都存在错分与漏分现象, 如散落在潮滩的盐地碱蓬和柽柳林被分为潮滩, 部分潮滩被分为柽柳林, 天然柳林与芦苇之间混分严重, 互花米草与芦苇之间的混分, 在水陆交界处, 部分河流被分为坑塘, 部分河流被分为养殖池塘。

2) 从生产者精度(PA)和用户精度(UA)来看, 柽柳林和天然柳林的分类精度较低, 这主要是受到它们空间分布的影响, 容易受到周围地物拓扑关联的影响, 但是天然柳林和柽柳林在整个区域中所占比重较小, 所以对总体信息提取精度的影响不大。其他地物的提取效果相对较好, 其中, 河流和耕地的提取精度较高, 在所有分类方案下的精度普遍达到90%以上, 主要是耕地和河流的特征明显, 易与周围地物分离。

3) 在基于不同数据的分类方案中, RF分类器的分类精度都高于SVM分类器, RF分类器的平均总体精度为90.61%, 比SVM分类器的平均总体精度高出2.83%; 在多时相原始光谱数据中, 加入各类特征后, RF分类器受到特征的影响较大, 分类精度曲线变化明显, SVM分类器受到特征的影响较小; 但仅凭精度难以区分2种分类算法的优劣, 因为分类算法受到算法参数的影响, 改变参数, 分类精度也会发生变化。

4) 基于RF-Pearson模型的特征优选方法, 在两种分类器的分类结果中, 分类精度都高于传统的RF模型的特征优选方法, 验证了RF-Pearson模型在特征优选方面的有效性。与不进行特征优选的多时相全特征相比, RF-Pearson特征优选对盐地碱蓬和天然柳林的生产者精度影响较大, 在RF分类器下, 盐地碱蓬的生产者精度提高7.62%, 天然柳林的生产者精度提高11.06%。

5) 从表 5的分类精度来看, 在多时相的基础上增加提取的特征, 能够提高湿地信息的分类效果, 但多特征容易产生“维度”灾难, 进行特征优选后精度提高。本文基于RF-Pearson模型特征优选的分类精度在两种分类器中都达到了最高, 其中, 采用RF分类器的信息提取精度较高, 总体精度为91.55%, Kappa系数为0.895, 表明了特征优选在湿地分类方面的优势。

4 结论

本文利用多时相Sentinel-2影像, 提取多时相特征并进行特征优选, 提出一种基于RF-Pearson模型的特征优选方法, 采用了随机森林和支持向量机2种分类器, 实现了黄河三角洲区域的湿地信息提取。优选特征利用较小的特征维数保留了较多的地物重要信息, 分类精度得到改善, 验证了RF-Pearson模型的特征优选方法的有效性, 也表明了特征优选在湿地分类方面的优势。

本文后续研究将考虑利用不同种类的卫星遥感数据源进行湿地协同分类, 并结合长时间序列遥感数据, 进行更细致的湿地信息提取研究。

参考文献
[1]
宫宁, 牛振国, 齐伟, 等. 中国湿地变化的驱动力分析[J]. 遥感学报, 2016, 20(2): 172-183.
GONG Ning, NIU Zhenguo, QI Wei, et al. Analysis on the driving forces of wetland change in China[J]. Journal of Remote Sensing, 2016, 20(2): 172-183.
[2]
宋百媛, 侯西勇, 刘玉斌. 黄河三角洲—莱州湾海岸带土地利用变化特征及多情景分析[J]. 海洋科学, 2019, 43(10): 24-34.
SONG Baiyuan, HOU Xiyong, LIU Yubin. Land use change characteristics and multi scenario analysis in the coastal zone of the Yellow River Delta Laizhou Bay[J]. Marine Sciences, 2019, 43(10): 24-34.
[3]
HU Y B, ZHANG J, MA Y, et al. Hyperspectral coastal wetland classification based on a multiobject convolutional neural network model and decision fusion[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(7): 1110-1114. DOI:10.1109/LGRS.2018.2890421
[4]
DU B J, MAO D H, WANG Z M, et al. Mapping wetland plant communities using unmanned aerial vehicle hyperspectral Imagery by comparing object/pixel-based classifications combining multiple machine-learning algorithms[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14(10): 8249-8258.
[5]
REZAEE M, MASOUD M, ZHANG Y, et al. Deep convolutional neural network for complex wetland classification using optical remote sensing imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018, 11(9): 3030-3039. DOI:10.1109/JSTARS.2018.2846178
[6]
高瑞, 王志勇, 周晓东, 等. 利用多时相遥感监测与分析黄河三角洲湿地变化动态[J]. 测绘通报, 2021, 19(4): 22-27.
GAO Rui, WANG Zhiyong, ZHOU Xiaodong, et al. Monitoring and analysis of wetland change in the Yellow River Delta by multi temporal remote sensing[J]. Bulletin of Surveying and Mapping, 2021, 19(4): 22-27.
[7]
魏鹏飞, 徐新刚, 杨贵军, 等. 基于多时相影像植被指数变化特征的作物遥感分类[J]. 中国农业科技导报, 2019, 21(2): 54-61.
WEI Pengfei, XU Xingang, YANG Guijun, et al. Crop remote sensing classification based on vegetation index change characteristics of multi temporal images[J]. China Agricultural Science and Technology Guide, 2019, 21(2): 54-61.
[8]
GUO H J, CAI Y P, YANG ZF, et al. Dynamic simulation of coastal wetlands for Guangdong-Hong Kong- Macao Greater Bay area based on multi-temporal Landsat images and FLUS model[J]. Ecological Indicators, 2021, 4(125): 107559-107559.
[9]
张磊, 宫兆宁, 王启为, 等. Sentinel-2影像多特征优选的黄河三角洲湿地信息提取[J]. 遥感学报, 2019, 23(2): 313-326.
ZHANG Lei, GONG Zhaoning, WANG Qiwei, et al. Wetland information extraction in the Yellow River Delta Based on multi feature optimization of Sentinel-2 image[J]. Journal of Remote Sensing, 2019, 23(2): 313-326.
[10]
梁爽, 宫兆宁, 赵文吉, 等. 基于多季相Sentinel-2影像的白洋淀湿地信息提取[J]. 遥感技术与应用, 2021, 36(4): 777-790.
LIANG Shuang, GONG Zhaoning, ZHAO Wenji, et al. Baiyangdian wetland information extraction based on multi seasonal Sentinel-2 image[J]. Remote Sensing Technology and Applicatio, 2021, 36(4): 777-790.
[11]
郝玉峰, 满卫东, 汪金花, 等. Relief-F算法及决策树方法下的湿地信息提取[J]. 辽宁工程技术大学学报(自然科学版), 2021, 40(3): 225-233.
HAO Yufeng, MAN Weidong, WANG Jinhua, et al. Wetland information extraction based on Relief-F algorithm and decision tree method[J]. Journal of Liaoning University of engineering and Technology (Natural Science Edition), 2021, 40(3): 225-233.
[12]
刘家福, 李林峰, 任春颖, 等. 基于特征优选的随机森林模型的黄河口滨海湿地信息提取研究[J]. 湿地科学, 2018, 16(2): 97-105.
LiU Jiafu, LI Linfeng, REN Chunying, et al. Study on information extraction of coastal wetland in the Yellow River Estuary based on random forest model with feature optimization[J]. Wetland Science, 2018, 16(2): 97-105.
[13]
夏盈, 厉恩华, 王学雷, 等. 基于特征优选的随机森林算法在湿地信息提取中的应用——以湖北洪湖湿地自然保护区为例[J]. 华中师范大学学报(自然科学版), 2021, 55(4): 639-648.
XIA Ying, LI Enhua, WANG Xuelei, et al. Application of random forest algorithm based on teature optimization in wetland information extraction — a case study of Honghu wetland nature reserve in Hubei Province[J]. Journal of Central China Normal University (Natural Science Edition), 2021, 55(4): 639-648.
[14]
GENUER R, POGGI J M, CHRISTINE T M. Variable selection using random forests[J]. Pattern Recognition Letters, 2010, 31(14): 2225-2236.
[15]
郑阳, 吴炳方, 张淼. Sentinel-2数据的冬小麦地上干生物量估算及评价[J]. 遥感学报, 2017, 21(2): 318-328.
ZHENG Yang, WU Bingfang, ZHANG Miao. Estimation and evaluation of aboveground dry biomass of winter wheat based on Sentinel-2 data[J]. Journal of Remote Sensing, 2017, 21(2): 318-328.
[16]
牟晓杰, 刘兴土, 阎百兴, 等. 中国滨海湿地分类系统[J]. 湿地科学, 2015, 13(1): 19-26.
MOU Xiaojie, LIU Xingtu, YAN Baixing, et al. Classification system of coastal wetlands in China[J]. Wetland Science, 2015, 13(1): 19-26.
[17]
ALFONSO F M, OSCAR F M, CARMEN Q. Sentinel-2A red-edge spectral indices suitability for discriminating burn severity[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 50(2): 170-175.
[18]
FORKUOR G, DIMOBE K, IDRISS S, et al. Landsat 8 vs Sentinel 2 examining the added value of sentinel 2 s red edge bands to land use and land cover mapping in Burkina Faso[J]. GIScience & Remote Sensing, 2018, 3(55): 331-354.
[19]
李晓敏, 张杰, 马毅, 等. 基于主成分分析和决策级融合的高光谱图像分类方法研究[J]. 海洋科学, 2015, 39(2): 25-34.
LI Xiaomin, ZHANG Jie, MA Yi, et al. Hyperspectral image classification based on principal component analysis and decision level fusion[J]. Marine Sciences, 2015, 39(2): 25-34.
[20]
詹国旗, 杨国东, 王凤艳, 等. 基于特征空间优化的随机森林算法在GF-2影像湿地分类中的研究[J]. 地球信息科学学报, 2018, 20(10): 1520-1528.
ZHAN Guoqi, YANG Guodong, WANG Fengyan, et al. Research on the random forest algorithm based on feature space optimization in wetland classification of GF-2 image[J]. Journal of Geo Information Science, 2018, 20(10): 1520-1528.