海洋科学  2023, Vol. 47 Issue (5): 2-14   PDF    
http://dx.doi.org/10.11759/hykx20220429010

文章信息

刘畅, 王岩, 王朝, 盛辉, 许明明, 刘善伟. 2023.
LIU Chang, WANG Yan, WANG Zhao, SHENG Hui, XU Ming-ming, LIU Shan-wei. 2023.
Sentinel-1与Sentinel-2影像联合的黄河三角洲湿地信息提取
Extraction of wetland information from Sentinel-1 and Sentinel-2 images in the Yellow River Delta
海洋科学, 47(5): 2-14
Marine Sciences, 47(5): 2-14.
http://dx.doi.org/10.11759/hykx20220429010

文章历史

收稿日期:2022-04-29
修回日期:2022-06-27
Sentinel-1与Sentinel-2影像联合的黄河三角洲湿地信息提取
刘畅1, 王岩2, 王朝2, 盛辉1, 许明明1, 刘善伟1     
1. 中国石油大学(华东)海洋与空间信息学院, 山东 青岛 266580;
2. 青岛市勘察测绘研究院, 山东 青岛 266000
摘要:针对目前湿地信息提取中存在的“同物异谱”、“同谱异物”问题, 以黄河三角洲自然保护区为实验区, 采用在信息提取方面具有优势的典型相关森林算法, 将Sentinel-1A雷达影像和Sentinel-2A多光谱影像作为基础数据, 考察分别应用多光谱影像、合成孔径雷达(Synthetic Aperture Radar, SAR)和多光谱二者综合、SAR纹理特征以及植被指数对湿地信息提取的效果和适用性。研究结果表明: (1)基于Sentinel-2A多光谱影像, 在分类方法上, 典型相关森林(canonical correlation forest, CCF)的总体精度最高, 达到94.32%, 与支持向量机和随机森林分类算法相比分别提高了6.55%和5.47%; (2)基于Sentinel-2A多光谱影像和Sentinel-1A后向散射系数的CCF总体精度达到了94.89%, 与只利用多光谱影像相比, 3种算法的总体精度和Kappa系数均得到了提升; (3)在SAR和光学联合的基础上加入SAR纹理特征后总体精度和Kappa系数均略有下降, 分别为94.72%和0.935 3; (4)在SAR和光学联合的基础上加入归一化差分植被指数(NDVI)、比值植被指数(RVI)、差值植被指数(DVI)、归一化差分红外指数(NDII)和差分红外指数(DII)5种植被指数后, 总体精度达到了最高为95.35%, 7种地物的生产者精度有所提高, 有效提高了对黄河三角洲湿地信息的提取能力。实验结果可为黄河三角洲湿地的合理开发和有效保护提供科学支持。
关键词信息提取    SAR    Sentinel-2    典型相关森林    黄河三角洲    
Extraction of wetland information from Sentinel-1 and Sentinel-2 images in the Yellow River Delta
LIU Chang1, WANG Yan2, WANG Zhao2, SHENG Hui1, XU Ming-ming1, LIU Shan-wei1     
1. College of Oceanography and Space Information, China University of Petroleum (East China), Qingdao 266580, China;
2. Qingdao Geotechnical Investigation and Surveying Research Institute, Qingdao 266000, China
Abstract: In order to solve the problems of "same object with different spectrum" and "foreign object with same spectrum" in wetland information extraction, the Yellow River Delta Nature Reserve was taken as the experimental area, and canonical correlation forest algorithm, which has advantages in information extraction, was adopted. Sentinel-1A radar image and Sentinel-2A multi-spectral image were taken as the basic data. The effects and applicability of multi-spectral image, Synthetic Aperture Radar (SAR) and multispectral synthesis, SAR texture feature and vegetation index for wetland information extraction were investigated. The results show that: (1) Based on Sentinel-2A multispectral images, the overall accuracy of Canonical Correlation Forest (CCF) is the highest, reaching 94.32%, which is 6.55% and 5.47% higher than that of support vector machine and random Forest classification algorithm, respectively; (2) The overall accuracy of CCF based on Sentinel-2A multispectral image and Sentinel-1A backscattering coefficient is 94.89%. Compared with the sentinel-2A multispectral image, the overall accuracy and Kappa coefficient of CCF based on sentinel-1A backscattering coefficient are improved; (3) The overall accuracy and Kappa coefficient decreased slightly after adding SAR texture feature, which were 94.72% and 0.935 3, respectively; (4) After adding Normalized Difference Vegetation Index (NDVI), Ratio Vegetation Index (RVI), Difference Vegetation Index (DVI), Normalized Difference Infrared Index (NDII) and Differential Infrared Index (DII) on the basis of SAR and optical combination, the overall accuracy is up to 95.35%.The producer accuracy of seven kinds of land features was improved, which effectively improved the extraction ability of wetland information in the Yellow River Delta. The experimental results can provide scientific support for the rational development and effective protection of the Yellow River Delta wetland.
Key words: information extraction    SAR    Sentinel-2    Canonical Correlation Forest    Yellow River Delta    

河口湿地位于陆地和海洋的交错过渡地带, 其生态系统极为脆弱且极具经济价值, 湿地植被是河口湿地中的重要组成部分, 在涵养水源、调节气候、维持生物多样性的方面具有重要作用[1]。随着气候的变化、人口和经济的增长、工业和港口的建设、水体的污染, 河口湿地面临着各种各样的压力, 严重影响了可持续发展的战略方针, 因此准确获取湿地中植物分布情况, 对于保护湿地生物多样性和恢复生态系统具有重要的意义。

由于遥感技术时效性高、获取数据快, 可大范围监测地物, 被广泛运用到湿地信息提取的研究中。在湿地信息提取中, 对于湿地类型的区分相对较难, 一些地物间的特点极为相似, 空间位置分布错综复杂, 边界模糊, 反映在遥感影像上的特征差异较小[2], 很容易产生“同物异谱”、“同谱异物”现象。在黄河三角洲研究中, 有学者利用数字表面模型、数字地形模型、坡度等区分植被[3], 还有学者利用特征优选方式选取不同月份最重要波段[4]、多端元光谱混合分析[5]等方法区分地物类型, 以此提高提取精度。目前, 已有多种遥感数据源被应用于湿地信息提取中, 杨朝辉等[6]利用Sentinel-2A影像, 提取苏州澄湖地区湿地信息, 总体精度达到80.67%, 对草地、坑塘和裸地的提取精度相对较低。Mleczko等[7]以Sentinel-1A和TanDEM-X为数据源对别布扎河湿地进行分类, 实验结果显示芦苇和甘草在微波散机制方面具有非常相似的特征, 分类结果只达到了40%的准确度。Gosselin等[8]针对RADARSAT-2影像采用Touzi分解方式对圣皮埃尔湿地进行提取, 提取出的山地森林和芦苇低洼沼泽精度较高, 茭白低沼泽和香蒲低沼泽精度相对较低。以上研究仅应用了单一的遥感影像, 实验结果存在误分类以及混淆严重的区域。光学影像具有丰富的光谱信息; 合成孔径雷达全天时观测且不受云层影响, 具有一定的地表穿透能力, 利用主被动遥感影像提取湿地信息已成为当前遥感技术应用的热点研究领域之一[9]。其中, 李鹏等[10]、Long等[11]和Franklin等[12]利用合成孔径雷达(Synthetic Aperture Radar, SAR)与光学联合影像分别对黄河三角洲湿地、洞庭湖生态经济圈和哈德逊湾低地生态区进行分类, 联合分类精度均在90%以上, 均高于两者单独分类的总体精度, 证明了SAR与光学联合影像在复杂环境中的优势。以上研究表明, 将SAR和多光谱影像相结合是一种行之有效的方法。

近年来机器学习成为遥感湿地信息提取的研究热点, 常用的方法有最大似然法[13-14]、随机森林(random forest, RF)[15-17]、支持向量机(support vector machine, SVM)[18]和决策树[19]等, 但在湿地信息提取中面对复杂地物类型很容易出现错分漏分现象[20-21]。Hong Pan[22]构建了基于特征序列的三维卷积神经网络算法开展了吉林白城市湿地信息提取, 并与传统的二维卷积神经网络、最大似然法和SVM进行精度比较, 结果表明优化后的三维卷积神经网络总体精度最高。Amani等[23]将最大似然、决策树、K最邻近、RF和SVM分类器进行组合, 对加拿大纽芬兰湿地进行信息提取, 结果表明多分类器系统提取效果优于单独使用以上5种算法。典型相关森林(canonical correlation forest, CCF)是一种决策树(decision tree, DT)集成技术, 用于识别超平面, 与其他分类器相比, CCF在逻辑上包含特征之间的相关性并使用“引导估计”将所有光谱带召回, 从而将集合分割到给定的可预测空间中。此外, 与SVM和RF相比, 无需频繁地改变CCF中的参数[24]

本文采用CCF算法, 选用Sentinel-1A和Sentinel-2A遥感影像, 并结合SAR纹理特征和植被指数对黄河三角洲湿地进行信息提取, 并与传统的SVM和RF算法进行对比, 探究和分析SAR与光学联合影像在对黄河三角洲典型地物提取研究中的作用, 为黄河三角洲地区生态环境遥感监测、合理开发和保护提供技术支撑。

1 研究区与数据 1.1 研究区概况

黄河三角洲自然保护区(37°42′N~37°50′N, 119°5′E~ 119°17′E)(图 1)是以保护黄河口新生湿地生态系统和珍稀濒危鸟类为主体的湿地类型自然保护区, 位于山东省东营市黄河入海口处, 北濒渤海, 东临莱州湾, 属于暖温带半湿润大陆性季风气候, 受海陆热力性质差异影响形成温带季风气候, 四季分明, 夏季高温多雨, 冬季寒冷干燥[25], 地势较低且平坦。保护区内植物资源丰富, 共有植物685种。盐地碱蓬和柽柳在自然保护区内广泛分布, 芦苇集中分布面积达40万亩。区内自然植被覆盖率达55.1%, 是中国沿海最大的新生湿地自然植被区。

图 1 研究区位置 Fig. 1 Location of the study area
1.2 数据与预处理 1.2.1 遥感数据

本研究以2019年9月29日的Sentinel-2A影像和2019年9月26日的Sentinel-1A影像为数据源。两幅影像数据均下载于欧洲航天局数据网站(https://scihub.copernicus.eu/)。

Sentinel-1卫星是欧洲航天局针对哥白尼计划研发的地球观测卫星, 由S1A和S1B两颗卫星组成, 载有C波段的合成孔径雷达(SAR), 可在全天候条件下提供连续图像。本文使用Sentinel-1 IW模式Level-1 GRD的产品, 地距单视分辨率为5 m×20 m, 极化方式为VV、VH, GRD数据是由SLC级数据经过多视处理、WGS84椭球投影至地距向的聚焦数据, 分辨率为10 m×10 m。Sentinel-2卫星是高分辨率多光谱成像卫星, 携带一枚多光谱成像仪(MSI)进行陆地监测, 分为2A和2B两颗卫星, Sentinel-2A各波段参数如表 1所示。对于雷达影像而言, Sentinel-1有双极化信息(VH、VV)。对于极化特征而言, 水平极化(H)能够穿透植物树冠层, 特别是对于土壤状况十分敏感。垂直极化(V)处理竖直结构的信息, 对于植物/树冠层的穿透十分敏感。VH和VV极化能包含不同的植被与土壤相互作用的信息。VH与VV的比值也被用作雷达影像的一个特征, 因为它能够有效缓解双向回弹现象(double-bounce effect), 系统误差和环境影像, 能进一步提供更有效的植被信息[26-27]

表 1 Sentinel-2A光谱波段信息 Tab. 1 Sentinel-2A spectral band information
波段 S2A中心波长/nm S2A波段宽度/nm 分辨率/m
B1海岸/气溶胶 442.7 21 60
B2蓝光 492.4 66 10
B3绿光 559.8 36 10
B4红光 664.6 31 10
B5植被红边1 704.1 15 20
B6植被红边2 740.5 15 20
B7植被红边3 782.8 20 20
B8近红外 832.8 106 10
B8a近红外 864.7 21 20
B9水汽 945.1 20 60
B10卷云 1 373.5 31 60
B11短波红外1 1 613.7 91 20
B12短波红外2 2 202.4 175 20

Sentinel-1数据预处理的目的是将Sentinel-1 C波段SAR原始强度信号数据转换为以分贝(dB)为单位的标度后向散射系数, 预处理步骤如下: 1)轨道校正, 避免由轨道误差引起的系统误差; 2)热噪声去除, 减弱由传感器等其他原因引起的周期性噪声; 3)采用精致Lee滤波(refined Lee)进行滤波处理, 抑制相干噪声; 4)地形校正, 改善图像畸变, 使其几何特征更符合真实地物; 5)辐射校正, 提取VH和VV通道的后向散射系数(Sigma0_VH和Sigma0_VV), 并导出为ENVI文件格式; 6)对后向散射系数图像进行波段计算, 得到VV/VH极化方式影像数据, 采用波段合成方式, 将VV、VH、VV/VH影像数据构成Sentinel-1后像散射系数数据集。

Sentinel-2数据已经过几何校正和辐射校正, 因此只需利用Sen2cor插件对Sentinel-2A的L1C数据进行大气校正, 得到L2A数据产品。选取大气校正后的9个波段, 分别为B2B3B4B5B6B7B8aB11B12用于提取湿地信息, 重采样为10 m。在此基础上, 为了较好判别湿地土地覆盖类型, 对Sentinel-2A数据进行相关性分析, 以信息量判断最佳波段组合, 如图 2所示, 采用B3B11B8a波段进行RGB假彩色合成。最后, 将预处理后的Sentinel-1A影像和Sentinel-2A影像进行地理配准, 配准误差小于0.5个像元。

图 2 RGB(B3B11B8a)假彩色合成 Fig. 2 RGB (B3, B11, B8a) false color synthesis
1.2.2 样本与验证数据

样本质量直接关系到湿地信息提取的精度, 应选择典型且具有代表性的纯净像元作为样本[28]。本文的样本数据主要来自于黄河三角洲湿地的现场实地踏勘和依据Google Earth高分辨率影像进行目视解译。2020年10月, 课题组对黄河三角洲自然保护区进行了现场勘察, 将研究区域内的地物类型划分为9类, 如表 2所示, 分别为互花米草、坑塘、芦苇、潮滩、裸地、河流海域、天然柳林、盐地碱蓬和柽柳, 对研究区内不同的植被分布和地物类型进行记录并拍照, 未记录的地物类型则通过Google Earth目视解译。为了避免因样本数据的比例不同而引起的误差[17], 本文设定的9类湿地地物样本数共3 485个, 以3∶2的比例, 将所有的样本随机分成训练数据和验证数据。

表 2 地物解译标志及样本数量 Tab. 2 Surface feature interpretation marks and sample quantity
地物类型 Sentinel-2A影像(波段B3-B11-B8a) 现场踏勘照片 地物特征解译 样本数/个
互花米草 主要分布于潮带间并向内扩散, 影像上盖度高的呈亮蓝色, 盖度低的呈暗蓝色。 883
坑塘 主要分布于黄河两岸较集中, 包括养殖、蓄水池塘, 影像中呈红色。 411
芦苇 多生长于黄河两岸以及坑塘中, 盖度较高, 影像中呈蓝绿色。 724
潮滩 淤泥滩含水量较大, 无植被覆盖, 影像中呈玫红色。 386
裸地 无植被覆盖的土地, 研究区中仅一块, 影像中呈绿色。 40
河流海域 河流和海水, 影像上呈红色。 301
天然柳林 分布较为分散, 混有芦苇, 影像中呈深蓝色。 163
盐地碱蓬 分布不均匀, 潮上带植株较大, 潮间带植株矮小, 影像中呈暗绿色。 404
柽柳 分布稀疏, 混有芦苇、盐地碱蓬, 影像中呈亮绿色。 173
2 研究方法 2.1 特征提取

针对黄河三角洲地物类型复杂、外观差异大、密度不均等特点, 选取SAR纹理特征和5种植被指数, 分析9种地物类型的可分性。

纹理的本质是空间中不同像素点的相互作用, 不同的地物类型在SAR影像上具有不同的纹理特征。灰度共生矩阵是一种经典且应用广泛的纹理分析方法[29]。本文选取角二阶矩、相关性、对比度、同质性和熵5个特征量作为纹理特征, 选取窗口大小为3×3, 计算5个特征量在0°、45°、90°和135°这4个方向的灰度共生矩阵, 并对4个方向的提取结果分别取平均。归一化差分植被指数(NDVI)应用及其广泛, 能够减弱与大气有关的影响, 增强植被信息[30]; 比值植被指数(RVI)对植被覆盖度高的区域较敏感, 与生物量的相关性较好, 能够反映各种植被盖度和生长状况的差异[31]; 差值植被指数(DVI), 对土壤的背景变化敏感, 有利于监测植被的生长状况[32]; 归一化差分红外指数(NDII)和差分红外指数(DII)对水分含量敏感, 能够反映不同地物类型对水吸收能力的差异[33-34]表 3详细描述了5种植被指数及其计算公式。

表 3 植被指数定义 Tab. 3 Definition of vegetation index
指数简称 指数全称 计算公式
NDVI Normalized Difference Vegetation Index (B8aB4)/(B8a+B4)
RVI Ratio Vegetation Index B8a/B4
DVI Difference Vegetation Index B8aB4
NDII Normalized Difference Infrared Index (B8aB11)/(B8a+B11)
DII Difference Infrared Index B8aB11
2.2 分类模型

典型相关森林(CCF)是由Rainforth等[35]于2015年提出的一种基于决策树的集成算法。如图 3所示, 该算法的主要思想是构造典型相关树(canonical correlation tree, CCT)的数目。通过应用典型相关分析(Canonical Correlation Analysis, CCA)来构建每个CCT, 以在特征(即光谱、后向散射系数、纹理特征和植被指数)和类别标签(即9种地物类别)之间提供最大相关性的特征投影, 并在该投影空间中使用穷举搜索法选择最佳分割[36]。CCF与RF相比, 有以下两点主要区别: (1)RF的每棵树都是根据训练数据集里随机且有放回地抽取一定数量的样本进行训练的, 而CCF的每棵树都是通过与训练数据集样本总数相同的训练子集训练的; (2)在RF中, 对决策树中每个节点分割时, 选择一组随机特征子集, 分割候选集对应于使用这些特征数据的所有唯一轴对齐分区。在CCF训练中, 也选取特征的一个随机子集, 但首先使用投影引导的CCA将特征投影到规范分量空间中, 并将分割候选集对应于该投影空间中唯一的分区, 所选择的分区意味着可以在测试时直接使用超平面分割[37]

图 3 CCF模型的简单结构 Fig. 3 Simple architecture of the CCF model

CCF的工作流程如下:

(1) 对训练数据集进行m次随机有放回地采样(m为训练数据集样本总数, 此过程称为Bagging), 形成N个训练子集;

(2) 对每个训练子集数据特征和标签进行典型相关分析, 得到典型相关系数和投影特征空间, 并将N个训练子集的原始数据特征投影到投影空间中;

(3) 在投影特征空间中, 使用穷举搜索从候选集合中选择最优分割来完成超平面分割, 分割以划分后数据集杂质更少为目标;

(4) 对每棵典型相关树模型进行独立训练生成单棵典型相关树, 对所有典型相关树进行集成得到典型相关森林;

(5) 对每棵树的结果采用多数投票的方式获得分类结果。

3 实验结果与分析 3.1 实验设计

表 4所示, 以Sentinel-2A多光谱影像(记为方案S2)、Sentinel-2A和Sentinel-1A影像二者综合(记为方案S1+S2)、加入SAR纹理特征(记为方案S1+ S2_M)以及加入5种植被指数(记为方案S1+S2_V)分别作为CCF的输入数据, 进行黄河口湿地典型地物类型的分类实验。为了验证CCF的精度, 分别与SVM和RF分类算法比较。SVM核函数选择RBF(径向基)核函数, 惩罚系数为100。RF选择树的数量为100, 特征数量为4。CCF树的棵数为100。

表 4 方案参数 Tab. 4 Scheme parameters
方案 数据组合
S2 Sentinel-2多光谱波段
S1+S2 Sentinel-2多光谱波段+Sentinel-1后向散射系数数据集
S1+S2_M Sentinel-2多光谱波段+Sentinel-1后向散射系数数据集+Sentinel-1纹理特征
S1+S2_V Sentinel-2多光谱波段+Sentinel-1后向散射系数数据集+Sentinel-2植被指数
3.2 分类结果与精度评定

8种不同方案的提取结果如图 4所示。定性评价具有一定的主观性, 故选取了总体精度(overall accuracy, OA, 记为AO)、Kappa系数、用户精度(user’s accuracy, UA, 记为AU) 和生产者精度(producer’s accuracy, PA, 记为AP)4项指标进行定量评价, 计算公式如(1)—(4)所示。

$ A_{\mathrm{O}}=\frac{\sum\nolimits_{i=1}^n m_{i i}}{N}, $ (1)
$ \text { Kappa }=\frac{N \sum\nolimits_{i=I}^n m_{i i}-\sum\nolimits_{i=1}^n\left(m_{i+} m_{+i}\right)}{N^2-\sum\nolimits_{i=I}^n\left(m_{i+} m_{+i}\right)}, $ (2)
$ A_{\mathrm{U}}=\frac{m_{i i}}{m_{i+}}, $ (3)
$A_{\mathrm{P}}=\frac{m_{i i}}{m_{+i}}, $ (4)

式中, n表示类别数目, N表示像元总数, mii表示被正确分类的像元数, mi+表示分类结果中第i类总和, m+i表示真实像元第i类总和。

采用验证数据对提取结果进行精度评价, CCF的分类结果最接近于黄河三角洲湿地的地物分布。由表 5和土地覆盖分类图 4(a)图 4(b)图 4(c)可以看出: 在Sentinel-2A影像的基础上, SVM分类算法得到的总体精度为87.77%, Kappa系数为0.850 2; RF的总体精度为88.85%, Kappa系数为0.863 9; CCF的总体精度为94.32%, Kappa系数为0.930 3。从生产者精度看, CCF对9种地物的分类精度均高于SVM和RF分类精度。与SVM算法相比, CCF算法的坑塘精度提高最为显著, 提高了15.72%, 芦苇和裸地的精度分别提升了10.54%和8.83%。与RF算法相比, CCF算法的天然柳林精度提高最为显著, 提高了8.09%, 坑塘和芦苇分别提高了7.79%和7.11%。由表 6表 7表 8可以看出, SVM和RF对于天然柳林和芦苇的提取结果较差, 错分较为严重, 主要错分为芦苇和互花米草。CCF对于高度相似的互花米草、天然柳林和芦苇三种地物的提取精度均有所提升, 漏分错分现象明显减少, 相较于RF和SVM, CCF算法更适应于黄河三角洲湿地信息提取。

表 5 光学影像的不同分类方法的精度评价 Tab. 5 Accuracy evaluation of different classification methods of optical images
地物类别 SVM_S2 RF_S2 CCF_S2
PA% UA% PA% UA% PA% UA%
互花米草 87.73 83.06 91.86 85.42 94.55 91.32
坑塘 80.54 74.10 88.47 71.90 96.26 88.81
芦苇 77.43 87.66 80.86 92.04 87.97 93.75
潮滩 94.44 91.97 97.81 90.22 99.16 95.31
裸地 83.82 100.00 86.76 93.65 92.65 96.92
河流海域 92.75 94.59 90.60 96.67 96.96 98.89
天然柳林 78.31 70.76 72.79 68.51 80.88 83.02
盐地碱蓬 96.10 96.34 92.45 98.26 97.74 99.36
柽柳 94.49 74.71 92.28 70.90 95.96 82.86
OA% 87.77 88.85 94.32
Kappa系数 0.850 2 0.863 9 0.930 3

图 4 不同分类算法的黄河三角洲湿地土地覆盖分类 Fig. 4 Land cover classification of wetland in the Yellow River Delta Based on different classification algorithms

表 6 SVM_S2方案分类结果混淆矩阵 Tab. 6 SVM_ S2 scheme classification result confusion matrix
地物类型 像元数
互花米草 坑塘 芦苇 潮滩 裸地 河流海域 天然柳林 盐地碱蓬 柽柳
互花米草 1 337 0 242 0 0 2 28 0 0
坑塘 0 538 38 0 0 150 0 0 0
芦苇 120 1 1 307 0 9 2 31 8 13
潮滩 0 2 6 561 0 32 0 9 0
裸地 0 0 0 0 57 0 0 0 0
河流海域 0 127 0 9 0 2 379 0 0 0
天然柳林 67 0 21 0 0 0 213 0 0
盐地碱蓬 0 0 3 24 0 0 0 764 2
柽柳 0 0 71 0 2 0 0 14 257

表 7 RF_S2方案分类结果混淆矩阵 Tab. 7 RF_ S2 scheme classification result confusion matrix
地物类型 像元数
互花米草 坑塘 芦苇 潮滩 裸地 河流海域 天然柳林 盐地碱蓬 柽柳
互花米草 1 400 5 200 0 0 1 33 0 0
坑塘 0 591 37 2 0 192 0 0 0
芦苇 48 1 1 365 0 5 4 41 6 13
潮滩 0 1 0 581 0 44 0 18 0
裸地 0 0 4 0 59 0 0 0 0
河流海域 0 69 0 11 0 2 324 0 0 0
天然柳林 76 1 14 0 0 0 198 0 0
盐地碱蓬 0 0 5 0 0 0 0 735 8
柽柳 0 0 63 0 4 0 0 36 251

表 8 CCF_S2方案分类结果混淆矩阵 Tab. 8 CCF_ S2 scheme classification result confusion matrix
地物类型 像元数
互花米草 坑塘 芦苇 潮滩 裸地 河流海域 天然柳林 盐地碱蓬 柽柳
互花米草 1 441 2 118 0 0 0 17 0 0
坑塘 0 643 27 0 0 54 0 0 0
芦苇 44 0 1 485 0 4 1 34 7 9
潮滩 0 1 0 589 0 23 0 5 0
裸地 0 0 2 0 63 0 0 0 0
河流海域 0 22 0 5 0 2 487 1 0 0
天然柳林 39 0 6 0 0 0 220 0 0
盐地碱蓬 0 0 3 0 0 0 0 777 2
柽柳 0 0 47 0 1 0 0 6 261

表 9的结果表明, 光学和SAR联合后有利于黄河三角洲湿地信息的提取, 3种方法中SAR与光学联合的分类精度均高于仅运用光学影像的分类精度。SVM算法相比于仅用光学影像总体精度和Kappa系数分别提升了1.70%和0.020 8, RF算法分别提升了2.03%和0.024 6, CCF算法分别提升了0.57%和0.005 0。从表 10和生产者精度看, CCF对光学和SAR联合的分类结果在互花米草、芦苇和天然柳林中均高于仅运用光学影像的分类结果, 其中天然柳林提高最大为5.88%, 互花米草和芦苇分别提升2.23%和1.19%。从图 4(c)图 4(f)可以看出, 研究区内天然柳林的生长较为分散且与芦苇伴生, 导致单一的光学影像无法精确提取天然柳林, 而SAR后向散射系数的加入极大改善了天然柳林的错分误分状况。

表 9 SAR与光学联合的不同分类方法的精度评价 Tab. 9 Accuracy evaluation of different classification methods combined with SAR and optics
地物类别 SVM_S1+S2 RF_S1+S2 CCF_S1+S2
PA% UA% PA% UA% PA% UA%
互花米草 90.94 84.93 95.54 86.82 96.78 93.12
坑塘 83.83 77.13 90.72 77.99 96.11 88.31
芦苇 80.04 90.37 81.04 92.75 89.16 94.65
潮滩 97.14 92.91 98.32 92.55 99.16 95.00
裸地 85.29 100.00 79.41 96.43 91.18 98.41
河流海域 93.72 95.47 93.37 97.40 96.26 98.80
天然柳林 73.90 72.04 80.15 89.34 86.76 89.39
盐地碱蓬 95.85 98.45 93.33 98.15 97.74 99.36
柽柳 94.85 75.22 93.01 68.19 95.22 81.70
OA% 89.47 90.88 94.89
Kappa系数 0.871 0 0.888 5 0.937 3

表 10 CCF_S1+S2方案分类结果混淆矩阵 Tab. 10 CCF_ S1+S2 scheme classification result confusion matrix
地物类型 像元数
互花米草 坑塘 芦苇 潮滩 裸地 河流海域 天然柳林 盐地碱蓬 柽柳
互花米草 1 475 0 101 0 0 0 8 0 0
坑塘 0 642 23 0 0 62 0 0 0
芦苇 32 0 1 505 0 3 4 28 7 11
潮滩 0 1 0 589 0 30 0 0 0
裸地 0 0 1 0 62 0 0 0 0
河流海域 0 25 0 5 0 2 469 0 0 0
天然柳林 17 0 11 0 0 0 236 0 0
盐地碱蓬 0 0 3 0 0 0 0 777 2
柽柳 0 0 44 0 3 0 0 11 259

表 11图 4(g)的结果表明, 在SAR和光学联合的基础上加入SAR纹理特征后, 总体精度和Kappa系数为94.72%和0.935 3, 均略有下降, 说明纹理特征不一定会提高提取精度, 由于信息的冗余导致精度降低。SAR纹理特征只对互花米草、潮滩、河流海域和盐地碱蓬的生产者精度略有提升, 由此说明纹理特征适用于纹理信息较为明显且单一的地物类型。

表 11 加入特征后的精度评价 Tab. 11 Accuracy evaluation after adding features
地物类别 CCF_S1+S2_M CCF_S1+S2_V
PA% UA% PA% UA%
互花米草 96.92 92.37 96.98 93.31
坑塘 95.21 87.72 96.26 90.82
芦苇 88.27 94.66 89.93 94.76
潮滩 99.66 95.48 99.49 95.32
裸地 89.71 100.00 92.65 96.93
河流海域 96.34 98.68 97.00 98.93
天然柳林 86.40 90.38 88.60 90.94
盐地碱蓬 97.99 99.49 97.23 99.49
柽柳 95.22 80.94 94.85 83.23
OA% 94.72 95.35
Kappa系数 0.935 3 0.942 9

表 11表 12图 4(h)可以看出, 加入植被指数后, 总体精度为95.35%, Kappa系数为0.942 9。天然柳林、裸地、芦苇、河流海域、潮滩、互花米草和坑塘的生产者精度分别提高了1.84%、1.47%、0.77%、0.74%、0.33%、0.20%和0.15%。结果表明, 植被指数的输入可以深入挖掘有利于地物区分的特征信息, 同时进一步提高总体分类精度。因此, 结合植被指数的遥感影像, 能利用优势、弥补缺陷, 提高黄河三角洲湿地信息提取精度。

表 12 CCF_S1+S2_V方案分类结果混淆矩阵 Tab. 12 CCF_ S1+S2_V scheme classification result confusion matrix
地物类型 像元数
互花米草 坑塘 芦苇 潮滩 裸地 河流海域 天然柳林 盐地碱蓬 柽柳
互花米草 1 478 0 100 0 0 0 6 0 0
坑塘 0 643 18 0 0 47 0 0 0
芦苇 32 0 1 518 0 5 4 25 6 12
潮滩 0 1 2 591 0 26 0 0 0
裸地 0 0 2 0 63 0 0 0 0
河流海域 0 24 0 3 0 2 488 0 0 0
天然柳林 14 0 10 0 0 0 241 0 0
盐地碱蓬 0 0 2 0 0 0 0 773 2
柽柳 0 0 36 0 0 0 0 16 258

综合来看, 3种算法的光学和SAR联合分类相较于仅应用光学影像分类精度明显提升, 漏分和错分的情况减少, 从分类结果和精度表看, CCF算法对黄河三角洲湿地地物的识别能力较强, 分类精度更高, SVM算法对湿地地物的识别能力相对较差。总的来说, 通过3种算法的实验, 验证了SAR与光学联合的分类方法对黄河三角洲湿地信息提取的优势。

4 结论与讨论

本文以黄河三角洲自然保护区为研究, 结合光学和SAR影像以及植被指数利用支持向量机、随机森林、典型相关森林3种算法开展黄河三角洲湿地信息提取, 通过以上研究, 得到以下结论:

(1) 基于Sentinel-2A多光谱影像, 应用3种分类方法得到的黄河三角洲湿地信息提取, 总体分类精度分别为87.77%、88.85%、94.32%, Kappa系数分别为0.850 2、0.863 9、0.930 3。CCF的分类结果与黄河三角洲湿地的真实地物高度吻合, 从生产者精度看, CCF提升了SVM和RF分别在坑塘和天然柳林的精度, 在一定程度上减少了地物像元的混分现象。在黄河三角洲湿地信息提取中, CCF分类模型具有更好的可行性。

(2) 利用Sentinel-2A多光谱结合VV、VH、VV/VH极化的Sentinel-1A SAR后向散射系数影像, 与光学影像相比, 3种分类方法的总体精度和Kappa系数均得到提升, 总计精度分别提高了1.70%、2.03%、0.57%, Kappa系数分别提高了0.020 8、0.024 6、0.007 0。由此说明, SAR与光学联合可以有效提高黄河三角洲湿地信息提取精度。

(3) 在SAR与光学联合的基础上加入SAR纹理特征后, CCF的总体精度和Kappa略有下降, 分别降低了0.17%和0.002 0, 说明SAR纹理特征不适用于黄河三角洲的湿地信息提取。

(4) 在SAR与光学联合的基础上加入NDVI、RVI、DVI、NDII和DII以上5种植被指数, 最终CCF总体精度提高0.46%, Kappa系数提高0.005 6, 天然柳林、裸地、芦苇、河流海域、潮滩、互花米草和坑塘的生产者精度均得到提高。

后续研究将考虑引入红边指数和多时相数据集, 采取多特征优选的湿地信息提取, 实现黄河三角洲典型地物的高精度智能识别, 进而为黄河三角洲自然保护区的管理和保护提供理论参考和技术支撑。

参考文献
[1]
宫宁, 牛振国, 齐伟, 等. 中国湿地变化的驱动力分析[J]. 遥感学报, 2016, 20(2): 172-183.
GONG Ning, NIU Zhenguo, QI Wei, et al. Driving force analysis of wetland change in China[J]. Journal of Remote Sensing, 2016, 20(2): 172-183.
[2]
马玥. 基于多源遥感信息综合的湿地土地覆被分类研究[D]. 长春: 吉林大学, 2018.
MA Yue. Wetland land cover classification based onmulti-source remote sensing information synthesis[D]. Changchun: Jilin University, 2018.
[3]
DING Q, LIU J B, YU J P, et al. Combination of LiDAR's multiple attributes for wetland classification: A case study of Yellow River Delta[J]. Canadian Journal of Remote Sensing, 2020, 46(6): 753-764. DOI:10.1080/07038992.2020.1867833
[4]
GONG Z N, ZHANG C, ZHANG L, et al. Assessing spatiotemporal characteristics of native and invasive species with multi-temporal remote sensing images in the Yellow River Delta, China[J]. Land Degradation & Development, 2020, 32(3): 1338-1352.
[5]
LIU J T, FENG Q L, GONG J H, et al. Land-cover classification of the Yellow River Delta wetland based on multiple end-member spectral mixture analysis and a Random Forest classifier[J]. International Journal of Remote Sensing, 2016, 37(8): 1845-1867. DOI:10.1080/01431161.2016.1165888
[6]
杨朝辉, 白俊武, 陈志辉, 等. 利用Sentinel-2A影像的面向对象特征湿地决策树分类方法[J]. 测绘科学技术学报, 2019, 36(3): 262-268.
YANG Zhaohui, BAI Junwu, CHEN Zhihui, et al. Wetland decision tree classification using sentinel-2A image based on surface object feature[J]. Journal of Surveying and Mapping Science and Technology, 2019, 36(3): 262-268.
[7]
MLECZKO M, MROZ M. Wetland Mapping using SAR Data from the Sentinel-1A and TanDEM-X missions: A comparative study in the Biebrza Floodpla in (Poland)[J]. Remote Sensing, 2018, 10(1): 78-78. DOI:10.3969/j.issn.1009-8518.2018.01.010
[8]
GOSSELIN G, TOUZI R, CAVAYAS F. Polarimetric Radarsat-2 wetland classification using the Touzi decomposition: case of the Lac Saint-Pierre Ramsar wetland[J]. Canadian Journal of Remote Sensing, 2014, 39(6): 491-506. DOI:10.5589/m14-002
[9]
解淑毓, 付波霖, 李颖, 等. 基于多维度遥感影像的洪河国家级自然保护区沼泽湿地分类方法研究[J]. 湿地科学, 2021, 19(1): 1-16.
XIE Shuyu, FU Bolin, LI Ying, et al. Wetland classification based on multi-dimensional remote sensing image in Honghe National Nature Reserve[J]. Wetland Science, 2021, 19(1): 1-16. DOI:10.13248/j.cnki.wetlandsci.2021.01.001
[10]
李鹏, 黎达辉, 李振洪, 等. 黄河三角洲地区GF-3雷达数据与Sentinel-2多光谱数据湿地协同分类研究[J]. 武汉大学学报(信息科学版), 2019, 44(11): 1641-1649.
LI Peng, LI Dahui, LI Zhenhong, et al. Wetland classification based on GF-3 radar data and Sentinel-2 multispectral data in the Yellow River Delta[J]. Journal of Wuhan University (Information Science), 2019, 44(11): 1641-1649.
[11]
LONG X R, LI X Y, LIN H, et al. Mapping the vegetation distribution and dynamics of a wetland using a daptive-stacking and Google Earth Engine based on multi-source remote sensing data[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 102: 102453. DOI:10.1016/j.jag.2021.102453
[12]
FRANKLIN S E, SKERIES E M, STEFANUK M A, et al. Wetland classification using Radarsat-2 SAR quad-polarization and Landsat-8 OLI spectral response data: a case study in the Hudson Bay Lowlands Ecoregion[J]. International Journal of Remote Sensing, 2018, 39(6): 1615-1627. DOI:10.1080/01431161.2017.1410295
[13]
刘焕军, 杨昊轩, 徐梦园, 等. 基于裸土期多时相遥感影像特征及最大似然法的土壤分类[J]. 农业工程学报, 2018, 34(14): 132-139, 304.
LIU Huanjun, YANG Haoxuan, XU Mengyuan, et al. Soil classification based on multi-temporal remote sensing imagecharacteristics and maximum likelihood method in bare soil[J]. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(14): 132-139, 304. DOI:10.11975/j.issn.1002-6819.2018.14.017
[14]
方炫, 安韶山, 薛志婧, 等. 基于最大似然法与矩法的黄土高原小流域土壤碳氮空间变异分析[J]. 水土保持通报, 2014, 34(4): 141-146.
FANG Xuan, AN Shaoshan, XUE Zhijing, et al. Spatial variation of soil carbon and nitrogen in small watershed of loess Plateau based on maximum likelihood method and moment method[J]. Bulletin of Soil and Water Conservation, 2014, 34(4): 141-146.
[15]
刘毅, 杜培军, 郑辉, 等. 基于随机森林的国产小卫星遥感影像分类研究[J]. 测绘科学, 2012, 37(4): 194-196.
LIU Yi, DU Peijun, ZHENG Hui, et al. Classification of domestic small satellite remote sensing Images based on random forest[J]. Science of Surveying and Mapping, 2012, 37(4): 194-196.
[16]
张晓羽, 李凤日, 甄贞, 等. 基于随机森林模型的陆地卫星-8遥感影像森林植被分类[J]. 东北林业大学学报, 2016, 44(6): 53-57, 74.
ZHANG Xiaoyu, LI Fengri, ZHEN Zhen, et al. Forest vegetation classification based on Landsat-8 remote sensing image based on random forest model[J]. Journal of Northeast Forestry University, 2016, 44(6): 53-57, 74.
[17]
张磊, 宫兆宁, 王启为, 等. Sentinel-2影像多特征优选的黄河三角洲湿地信息提取[J]. 遥感学报, 2019, 23(2): 313-326.
ZHANG Lei, GONG Zhaoning, WANG Qiwei, et al. Extraction of wetland information from Sentinel-2image based on multi-feature optimization[J]. Journal of Remote Sensing, 2019, 23(2): 313-326.
[18]
张静, 刘忠宝, 宋文爱, 等. 基于多类支持向量机的恒星光谱分类方法[J]. 光谱学与光谱分析, 2018, 38(7): 2307-2310.
ZHANG Jing, LIU Zhongbao, SONG Wenai, et al. Spectral classification of stars based on multi-class Support vector Machine[J]. Spectroscopy and Spectral Analysis, 2018, 38(7): 2307-2310.
[19]
陈磊士, 高霞霞, 廖玉芳, 等. 基于CART决策树的高分二号洞庭湖区湿地分类方法[J]. 测绘通报, 2021(6): 12-15.
CHEN Leishi, GAO Xiaxia, LIAO Yufang, et al. Wetland classification in Dongting Lake Area based on Gaofen-2 CART decision Tree[J]. Bulletin of Surveying and Mapping, 2021(6): 12-15.
[20]
刘翔, 刘会玉, 林振山, 等. 基于Landsat OLI影像的盐城滨海湿地分类方法对比研究[J]. 湿地科学, 2017, 15(5): 689-696.
LIU Xiang, LIU Huiyu, LIN Zhenshan, et al. Comparison of classification methods of coastal wetlandsin Yancheng based on Landsat OLI image[J]. Wetland Science, 2017, 15(5): 689-696.
[21]
陈富龙, 王超, 张红. 改进最大似然遥感影像分类方法——以SAR影像为例[J]. 国土资源遥感, 2008(1): 75-78.
CHEN Fulong, WANG Chao, ZHANG Hong. Remote Sensing image classification based on an improved maximum-likelihood method: with SAR images as an example[J]. Remote Sensing for Land and resources, 2008(1): 75-78.
[22]
PAN H. A feature sequence-based 3D convolutional method for wetland classification from multispectral images[J]. Remote Sensing Letters, 2020, 11(9): 837-846.
[23]
AMANI M, ASLEHI B, MAHDAVI S, et al. A Multiple Classifier System to improve mapping complex land covers: a case study of wetland classification using SAR data in Newfoundland, Canada[J]. International Journal of Remote Sensing, 2018, 39(21): 7370-7373.
[24]
SAHIN E K, COLKESEN I, KAVZOGLU T, et al. A comparative assessment of canonical correlation forest, random forest, rotation forest and logistic regression method for landslide susceptibility mapping[J]. Geocarto International, 2020, 35(1/4): 341-363.
[25]
刘莉, 韩美, 刘玉斌, 等. 黄河三角洲自然保护区湿地植被生物量空间分布及其影响因素[J]. 生态学报, 2017, 37(13): 4346-4355.
LIU Li, HAN Mei, LIU Yubin, et al. Spatial distribution and influencing factors of wetland vegetation biomass in Yellow River Delta Nature Reserve[J]. Acta Ecologica Sinica, 2017, 37(13): 4346-4355.
[26]
VELOSO A, MERMOZ S, BOUVET A, et al. Understanding the temporal behavior of crops using Sentinel-1 and Sentinel-2-like data for agricultural applications[J]. Remote Sensing of Environment, 2017, 199: 415-426.
[27]
陶圆. 结合光学与雷达遥感数据的覆膜农田机器学习分类制图对比研究[D]. 杭州: 浙江大学, 2021.
TAO Yuan. Comparative study on classification mapping of mulched farmland based on machine learning combined with optical and radar remote sensing data[D]. Hangzhou: Zhejiang University, 2021.
[28]
刘舒, 姜琦刚, 马玥, 等. 基于多目标遗传随机森林特征选择的面向对象湿地分类[J]. 农业机械学报, 2017, 48(1): 119-127.
LIU Shu, JIANG Qigang, MA Yue, et al. Object-oriented wetland classification based on multi-objective Genetic random Forest Feature Selection[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(1): 119-127.
[29]
付仲良, 张文元, 孟庆祥. 灰度和纹理特征组合的SAR影像SVM分类[J]. 应用科学学报, 2012, 30(5): 498-504.
FU Zhongliang, ZHANG Wenyuan, MENG Qingxiang. SVM classification of SAR image based on gray scale and texture feature combination[J]. Chinese Journal of Applied Science, 2012, 30(5): 498-504.
[30]
刘鹤. 基于深度学习的高分辨率遥感影像森林参数提取研究[D]. 长春: 吉林大学, 2021.
LIU He. Forest parameter extraction from high-resolution remote sensing images based on deep learning[D]. Changchun: Jilin University, 2021.
[31]
刘超. 基于遥感数据的1995~2020年加拿大Alberta油砂矿区周边植被变化研究[D]. 长春: 吉林大学, 2021.
LIU Chao. Vegetation change around the Alberta oilsands mining area in Canada from 1995 to 2020 based on remote sensing data[D]. Changchun: Jilin University, 2021.
[32]
LI X W, JI G S, YANG J. Estimating cyanophyta biomass standing crops in Meiliang Gulf of Lake Taihu by satellite remote sensing[J]. Remote Sensing for Land and Resources, 1995, 7(2): 3-28.
[33]
EMILY H W, STEVEN A S. Detection of forest harvest type using multiple dates of Landsat TM imagery[J]. Remote Sensing of Environment, 2002, 80(3): 385-396.
[34]
朱玉玲, 王建步, 王安东, 等. 融合浅层特征的深度卷积神经网络互花米草遥感监测方法[J]. 海洋科学, 2019, 43(7): 12-22.
ZHU Yuling, WANG Jianbu, WANG Andong, et al. Remote sensing monitoring method of Spartina alterniflora based on deep convolutional neural network[J]. Marine Sciences, 2019, 43(7): 12-22.
[35]
RAINFORTH T, WOOD F. 2015. Canonical correlation forests[J/OL]. Computer Science, 2017: 1-51[2017-08-09]. https://arxiv.org/abs/1507.05444.pdf.
[36]
NAM T H, MERILYN M H, TIEN D P, et al. A comparative assessment of ensemble based machine larning and maximum likelihood methods for mapping seagrass using Sentinel-2 imagery in Tauranga Harbor, New Zealand[J]. Remote Sensing, 2020, 12(3): 355-371.
[37]
ISMAIL C, TASKIN K. Ensemble-based canonical correlation forest (CCF) for land use and land cover classification using Sentinel-2 and Landsat OLI imagery[J]. Remote Sensing Letters, 2017, 8(11): 1082-1091.