海洋科学  2025, Vol. 49 Issue (10): 1-13   PDF    
http://dx.doi.org/10.11759/hykx20250118001

文章信息

张磊, 赵宽, 魏来, 管守德, 赵玮. 2025.
ZHANG Lei, ZHAO Kuan, WEI Lai, GUAN Shoude, ZHAO Wei. 2025.
基于Sentinel-2卫星和优化RBF模型反演香港海域叶绿素a浓度
Inversion of chlorophyll a concentration in Hong Kong waters based on Sentinel-2 satellite and optimized RBF model
海洋科学, 49(10): 1-13
Marine Sciences, 49(10): 1-13.
http://dx.doi.org/10.11759/hykx20250118001

文章历史

收稿日期:2025-01-18
修回日期:2025-02-19
基于Sentinel-2卫星和优化RBF模型反演香港海域叶绿素a浓度
张磊1, 赵宽1, 魏来1, 管守德1,2, 赵玮1,2     
1. 海南省海洋立体观测与信息重点实验室, 中国海洋大学三亚海洋研究院, 海南 三亚 572024;
2. 物理海洋教育部重点实验室, 山东 青岛 266100
摘要:叶绿素a浓度是评估水质状况的重要参数之一, 然而因为近海的二类水体光谱特征复杂, 影响了其中叶绿素a浓度反演的可靠性。本文提出了一种动态K-means聚类与粒子群最优化算法(Particle Swarm Optimization, PSO)优化的径向基神经网络反演模型, 用以提高叶绿素a浓度反演的精度。以Sentinel-2多光谱成像仪作为遥感数据源, 选择与香港近海的叶绿素a浓度监测点时间相同、云覆盖率低于10% 的遥感影像, 并提取对应叶绿素a浓度监测点的遥感反射率, 并与其进行相关性分析。在此基础上, 选择具有较高相关性的波段及波段组合B2、1/B2、1/B3、B2-B4, 构建优化后的RBF模型, 并与传统经验模型和传统RBF模型作为比较。结果表明: 优化的RBF模型决定系数为0.90, 均方根误差为0.23 μg·L–1, 两种算法优化后的RBF模型对近海二类水体中叶绿素a浓度反演的可靠性远远高于传统经验模型和传统RBF模型。同时反演结果显示香港近海海域叶绿素a浓度从西到东呈现低–高–低的空间分布, 局部上呈现近岸高、外海逐渐降低的特征。
关键词叶绿素a浓度    RBF神经网络    动态K-means聚类    粒子群最优化算法    香港近海    
Inversion of chlorophyll a concentration in Hong Kong waters based on Sentinel-2 satellite and optimized RBF model
ZHANG Lei1, ZHAO Kuan1, WEI Lai1, GUAN Shoude1,2, ZHAO Wei1,2     
1. Key Laboratory of Ocean Observation and Information of Hainan Province, Sanya Oceanographic Institution, Ocean University of China, Sanya 572024, China;
2. Physical Oceanography Laboratory, Qingdao 266100, China
Abstract: Chlorophyll-a concentration is a crucial parameter for the aquatic environment. However, because of the complexity of the spectral characteristics of offshore Case-Ⅱ water, which affects the reliability of the inversion of chlorophyll-a concentration in them. To assess the suitability of the radial basis function (RBF) neural network, enhanced by the dynamic K-means clustering and particles swarm optimization, for chlorophyll-a concentration inversion in Case-Ⅱ water, Sentinel-2 multispectral image remote sensing data were employed. Hong Kong offshore served as the study area. Sampling points with matching remote sensing image data were chosen based on consistent chlorophyll-a collection times, ensuring cloud coverage rates below 10%. Remote sensing image data underwent preprocessing to obtain reflectance values aligned with the monitoring dates. On this basis, bands with high correlation and their combinations B2, 1/B2, 1/B3 and B2-B4 were selected to construct the optimized RBF model, and compared with the traditional empirical model and the traditional RBF model. Results indicated an R2 value of 0.90 for the optimized RBF model, surpassing the traditional RBF models and empirical models. Additionally, the optimized RBF model's suitability for chlorophyll-a concentration inversion in Case-Ⅱ water was confirmed. Using the trained and optimized RBF model, chlorophyll-a concentration inversion in Hong Kong's offshore waters was executed using Sentinel-2 MSI data. The spatial distribution exhibited a pattern of low-high-low from west to east. Notably, certain areas within Hong Kong offshore waters displayed higher chlorophyll-a concentrations compared to the surrounding external waters.
Key words: chlorophyll-a concentration    RBF neural network    dynamic K-means clustering algorithm    particle swarm optimization    Hong Kong offshore waters    

近几十年来, 人类活动对海洋生态环境的影响越来越大, 某些近海海域的生态系统受损, 生态功能减弱, 水质急剧恶化。因此, 监测近海海域水质状况, 评估近海海域生态环境, 实现近海海域的生态修复与可持续发展已迫在眉睫。叶绿素a的质量浓度(下文简称叶绿素a浓度)是评估水域初级生产力和营养状况的关键指标, 也代表了藻类和浮游植物的关键特征, 对近海海域叶绿素a浓度进行有效监测有助于预防近岸水质的持续恶化[1-4]

叶绿素a浓度监测的传统方法过程繁琐, 而在线原位监测等新型监测手段受时间和空间的局限, 导致难以快速、动态、大面积评价水体叶绿素a浓度水平[5-6]。近几十年, 遥感技术迅猛发展, 使用遥感技术对叶绿素a浓度进行监测, 具有快速、覆盖范围广、实时动态的巨大优势[7-9]。从遥感信息中获取叶绿素a浓度和水体光谱反射率间的关系, 对水体的叶绿素a浓度进行反演, 可以实现对水体水质高频次、大范围的实时监测。经过近几十年的研究和探索, 叶绿素a浓度遥感反演在国内外取得了长足进展。根据反演模型构建的原理不同, 叶绿素a浓度反演模型可以分为经验、半经验模型、半分析和分析模型[10-14]。目前大洋等一类水体的蓝绿波段比值法已取得较好的效果, 实现了业务化推广, 但此类算法在光学特征复杂的二类水体或者近海海域和内陆中应用受限, 因为在这些水体中光谱特征与组分浓度之间难以用简单线性关系表示[15]。为解决此问题, 发展出了一系列更适用于二类水体的算法, 如红光-近红外二波段算法、三波段算法和四波段算法等[13-14, 16-19]; 杜耀[20]以深度学习为模型, 通过时空谱融合算法得到高分辨率遥感影像为数据源, 成功反演了白洋淀的水体叶绿素a浓度。但是大部分反演算法普适性差, 容易受到区域和季节性影响, 少数适应性较好的算法也有待进一步验证。

径向基(Radial Basis Function, RBF)神经网络能够近似各种非线性函数, 应对系统中难以明确规律的模式, 并展现出出色的泛化性能, 其学习速度快且能迅速收敛[21], 已在非线性函数逼近、时间序列研究和信息处理等领域取得了成功应用[22-23]。然而传统的RBF神经网络参数优化方式在训练速度方面存在局限, 且易受局部最小值困扰。已有学者研究并运用优化的RBF神经网络模型对二类水体的悬浮物浓度进行了成功反演, 例如, 谢旭等[15]应用了高分一号(GF-1)遥感影像数据, 对粒子群最优化算法(Particle Swarm Optimization, PSO)优化后的RBF模型进行训练, 成功反演了闽江下游水体悬浮物浓度的变化情况; 吕君伟等[21]基于2009年3月份ETM+影像数据和香港环保署实测采样点数据, 建立了光谱反射与悬浮物浓度之间的PSO-RBF反演模型, 与线性模型相比, 预测精度有了明显的提升。

本文选取香港近海海域为研究区域(图 1), 以实测叶绿素a浓度和对应采样点的遥感反射率为数据基础, 利用动态K-means聚类算法确定RBF神经网络的隐节点中心, 使用PSO算法对RBF神经网络的隐节点宽度和连接权值进行优化求解, 从而优化RBF神经网络参数, 建立叶绿素a浓度的反演模型。运用Sentinel-2多光谱成像仪(Multispectral Imager, MSI)获取的遥感影像数据进行反演, 并与传统RBF神经网络模和传统经验模型进行比较, 为今后香港近海海域叶绿素a浓度反演提供参考。

图 1 香港近海海域叶绿素a浓度监测采样点分布 Fig. 1 Distribution map of chlorophyll a concentration monitoring sampling points in the coastal waters near Hong Kong 注: 红点为检测采样点; 图片来自香港环保署官网发布的《2024年香港海水水质报告》中的附录A-2
1 数据与方法 1.1 数据获取与预处理 1.1.1 实测数据获取

香港位于南海北部, 其近海海域向南与南海相通, 西侧是珠江口, 东边是一个半封闭的海域, 地理范围22°9′~22°37′N, 113°49′~114°27′E(图 1)。由于其地理位置和周围环境的特点, 香港近海海域受到陆地和海洋综合污染的明显影响, 其水质属于二类水体[24]。本研究中所采用的香港近海叶绿素a浓度实测数据来源于香港环保署的官方网站(http://cd.epic.epd.gov.hk/), 这些数据覆盖了10个水质控制区, 并每月在香港的76个开放水域监测站进行记录。为确保数据质量, 选择了与Sentinel-2遥感影像日期相匹配、天气晴朗的数据, 叶绿素a质量浓度的单位为μg∙L–1

1.1.2 遥感影像数据获取及处理

Sentinel-2是搭载了MSI的高分辨率多光谱成像卫星, 由Sentinel-2A(S2A)和Sentinel-2B(S2B)两颗卫星组成, 轨道彼此相差180°, 覆盖13个工作波段, 幅宽达290 km, 放置在地球的两端。图像采集周期为每颗卫星10 d, 双星联合观测实现了5 d的时相分辨率, 空间分辨率分别为10 m、20 m、60 m, 卫星数据如表 1所示。通过欧洲航天局哥白尼数据中心(https://scihub.copernicus.eu/)下载了2019—2022年研究区域上空云覆盖率低于30%且晴朗的Sentinel-2影像, 共204幅, 选择其中云覆盖率低于10%的影像作为建模研究数据源, 共27幅, 其中18幅为Sentinel-2A, 9幅为Sentinel-2B(表 2)。

表 1 Sentinel-2传感器光谱特征信息 Tab. 1 Sentinel-2 sensor spectral characteristic information
波段 Sentinel-2A Sentinel-2B 分辨率/m
中心波段/nm 带宽/nm 中心波段/nm 带宽/nm
1 443.9 27 442.3 45 60
2 496.6 98 492.1 98 10
3 560.0 45 559 46 10
4 664.5 38 665 39 10
5 703.9 19 703.8 20 20
6 740.2 18 739.1 28 20
7 782.5 28 779.7 28 20
8 845.1 145 833 133 10
8a 864.8 33 864 32 20
9 945.0 26 943.2 27 60
10 1 373.5 75 1 376.9 76 60
11 1 613.7 143 1 610.4 141 20
12 2 202.4 242 2 185.7 238 20

表 2 Sentinel-2 MSI成像参数 Tab. 2 Sentinel-2 MSI imaging parameters
时间 景号
2019-10-17 S2B_MSIL2A_20191017T025709_N0500_R032_T49QHE_20230614T210212
S2B_MSIL2A_20191017T025709_N0500_R032_T49QGE_20230614T210212
2019-11-08 S2A_MSIL2A_20191108T024921_N0500_R132_T49QHE_20230610T140848
2019-12-11 S2A_MSIL2A_20191211T030121_N0500_R032_T49QHE_20230617T021137
2020-11-05 S2A_MSIL2A_20201105T025911_N0500_R032_T49QHE_20230320T185816
S2A_MSIL2A_20201105T025911_N0500_R032_T49QGE_20230320T185816
2021-02-18 S2B_MSIL2A_20210218T025749_N0500_R032_T50QKK_20230605T201259
2021-03-12 S2A_MSIL2A_20210312T024551_N0500_R132_T49QHE_20230528T003417
2021-03-17 S2B_MSIL2A_20210317T024549_N0500_R132_T50QKK_20230515T002557
2021-04-21 S2A_MSIL2A_20210421T024541_N0500_R132_T49QHE_20230518T095113
2021-07-10 S2A_MSIL2A_20210710T024551_N0500_R132_T50QKK_20230204T125630
2021-10-06 S2B_MSIL2A_20211006T025559_N0500_R032_T49QGE_20230108T011713
2021-10-11 S2A_MSIL2A_20211011T025641_N0500_R032_T49QHE_20230112T161309
S2A_MSIL2A_20211011T025641_N0500_R032_T49QGE_20230112T161309
2021-11-10 S2A_MSIL2A_20211110T025941_N0500_R032_T49QHE_20221229T155909
S2A_MSIL2A_20211110T025941_N0500_R032_T49QGE_20221229T155909
2021-11-25 S2B_MSIL2A_20211125T030029_N0500_R032_T49QGE_20230106T010521
2021-12-05 S2B_MSIL2A_20211205T030109_N0500_R032_T50QKK_20221224T042405
2022-04-04 S2B_MSIL2A_20220404T025539_N0400_R032_T49QGE_20220404T064535
S2B_MSIL2A_20220404T025539_N0400_R032_T49QHE_20220404T064535
2022-07-28 S2A_MSIL2A_20220728T025531_N0400_R032_T49QGE_20220728T075355
S2A_MSIL2A_20220728T025531_N0400_R032_T49QHE_20220728T075355
2022-09-06 S2A_MSIL2A_20220906T025541_N0400_R032_T49QGE_20220906T080359
S2A_MSIL2A_20220906T025541_N0400_R032_T49QHE_20220906T080359
2022-10-26 S2A_MSIL2A_20221026T025811_N0400_R032_T49QHE_20221026T072358
S2A_MSIL2A_20221026T025811_N0400_R032_T49QGE_20221026T072358
2022-12-25 S2A_MSIL2A_20221225T030131_N0510_R032_T49QHE_20240806T144627

本次研究中使用的是Sentinel-2的L2A级遥感影像数据, 已经过欧空局哥白尼数据中心预处理, 在L1C级基础上完成了大气校正、辐射定标、几何校正等步骤, 只需要进行重采样、波段融合以及波段反射率提取。首先使用由欧洲航天局开发的哨兵应用平台(Sentinels Application Platform, SNAP)中的Raster-Resampling工具包, 调整重采样的分辨率需求参数为10 m, 运用了最邻近像元法进行重采样。对重采样后的遥感影像数据, 采用ENVI遥感影像处理软件(Environment for Visualizing Images, Harris Geospatial Solutions公司)的Layer Stacking插件, 选择B1至B12共12个波段(第8个波段有B8和B8a两种, 分别对应S2A和S2B卫星, 表 1所示), 利用最邻近像元法进行波段融合。最后利用ENVI软件中Input Points from ASCII把采样点的位置信息加载到波段融合后的图像中, 选择Output ROIs to ASCII得到与实测点对应的各个波段遥感反射率。数据获取后, 剔除缺测、异常值及受云影响的数据, 最终得到52组数据, 每组数据包含对应监测站点的实测值和12个波段的遥感反射率。

1.1.3 遥感反射率与叶绿素a浓度相关性分析

根据叶绿素a的光谱特性, 如图 2所示[25], 在蓝光区域(约430~480 nm)和红光区域(约640~680 nm)有2个主要吸收峰, 在绿色区域(约520~570 nm)和685~ 700 nm附近则有两个吸收谷[26-27]。而Sentinel-2 MSI传感器设置的B1至B4波段波长与其对应, 其中心波长分别为443 nm、490 nm、560 nm、665 nm。进一步分析水体反射率与叶绿素a浓度的相关性, 用52组数据做不同叶绿素a浓度水体的Sentinel-2 MSI波段光谱特性, 结果如图 3所示。综上研究表明, Sentinel-2 MSI传感器提供B1至B4波段的遥感数据信息, 对叶绿素a浓度相对比较敏感, 用于叶绿素a浓度遥感反演有较高的可靠性。

图 2 叶绿素a吸收光谱 Fig. 2 Chlorophyll a absorption spectrum

图 3 波段光谱特征 Fig. 3 Band spectral characteristics

结合海洋叶绿素a浓度反演研究的经验, 对Sentinel-2 MSI B1—B4波段进行组合运算[28-29], 根据表中的个数, 应产生153种组合类别(表 3)。并对153种组合与叶绿素a浓度做Pearson相关性分析, 提取达到强相关的波段组合, 结果如表 4所示: 波段组合中B2、1/B2、1/B3、B2-B4相关性较好, 相关系数都高于0.78, 其余波段组合相关性相对较差。

表 3 不同波段组合形式 Tab. 3 Forms of different band combinations
波段组合类型 组合方式 个数
单一波段类 Bi, 1/Bi, i (1, 2, 3, 4) 8
比值植被指数类RVI(i, j) RVI(i, j)=Bi/Bj, ij (1, 2, 3, 4) 6
差值植被指数类DVI(i, j) DVI(i, j)=Bi−Bj, ij (1, 2, 3, 4) 6
归一化植被指数类NDVI(i, j) NDVI(i, j)=(Bi−Bj)/(Bi+Bj), ij (1, 2, 3, 4) 6
三波段 Bi×(Bm+Bn), Bi×(Bm−Bn), (Bi+Bm)/(Bi+Bn),
(Bi−Bm)/(Bi+Bn), (Bi−Bm)/(Bi−Bn), imn(1, 2, 3, 4)
94
四波段 (Bi−Bm)/(Bi+Bn), (Bi−Bm)/(Bi−Bn), imn(1, 2, 3, 4) 33
注: 表中BX表示为监测点在第X波段上的监测数据, 下文同

表 4 强相关性波段组合 Tab. 4 Strong correlation band combinations
波段组合 相关系数 波段组合 相关系数
B1 –0.68 B2 –0.79
B3 –0.76 1/B1 0.77
1/B2 0.79 1/B3 0.78
1/B4 0.61 B2–B4 –0.79
B3−B4 –0.67 B2×(B3–B4) –0.73
B3×(B2−B4) –0.75
1.2 研究方法 1.2.1 RBF神经网络

RBF是一种具有径向对称衰减的函数, 把RBF应用于神经网络的隐含层作为激活函数就构成了RBF神经网络, 最早由Broomhead和Lowe在1988年建立, 主要用于模式识别、函数逼近和数据聚类等任务[30]。本次研究中, 以实测点遥感反射率为输入层, 对应实测点的叶绿素a浓度值为输出层, RBF神经网络结构如图 4所示。

图 4 RBF神经网络结构 Fig. 4 The structure of RBF neural network

输入层到隐含层需要激活函数, 由于高斯基函数具备表现形式简单、径向对称、光滑性好、易于进行理论分析等优点[31], 以高斯基函数作为激活函数, 其公式为

$ \mathop \varphi \nolimits^i (t)\left\| {{X_t} - {\phi _i}} \right\| = \exp \left( { - \frac{{{{\left\| {{X_t} - {\phi _i}} \right\|}^2}}}{{2\sigma _i^2}}} \right) . $ (1)

输出层可与隐含层节点加权通过线性变化得到, 假设输出层节点数为p, 其公式为

$ {Y_p} = \sum\nolimits_{i = 1}^m {{W_i}\exp \left( { - \frac{{{{\left\| {{X_p} - {\phi _i}} \right\|}^2}}}{{2\sigma _i^2}}} \right)} , $ (2)

式中, ${\phi _i}$为第i个隐节点中心, σi为第i个隐节点宽度(即扩展常数), Wi为第i个隐节点连接权值, Xp为第p个输入样本向量, m为隐含层隐含节点数及隐单元个数, Yp为与Xp对应的输出样本值。

从式(1)、(2)可以看出, 实际使用RBF神经网络中, 以高斯基函数作为激活函数对神经网络性能的影响并不是至关重要的, 关键是如何确定各隐节点中心$ {\phi _i} $、各隐节点宽度σi以及各节点连接权值Wi。因此, 本文运用了PSO算法和动态K-means聚类算法, 对这3个参数的确定进行优化。

1.2.2 动态K-means聚类算法

传统K-means聚类算法需要人为确定初始聚类中心, 但不同的初始聚类中心可能导致完全不同的聚类结果[32], 而动态K-means聚类算法具有原理简单、模型清晰、操作方便、计算快速等特点, 可以大规模同时对多种类型的数据进行聚类, 快速挖掘出数据中隐含的关系和结构, 并且有效解决了传统K-means聚类算法的局限性问题, 具体算法步骤如下。

假定预设距离限值η, 输入的第一个样本向量作为第一个聚类中心(即隐节点中心), 之后每当输入一个新的向量, 计算该向量与各聚类中心的欧氏距离:

$ d = \left\| {{X^p} - {C_j}} \right\| = {\left[ {\sum\nolimits_{i = 1}^n {{{\left( {X_i^p - {C_{ji}}} \right)}^2}} } \right]^{\frac{1}{2}}} , $ (3)

式中, n是输入向量的维数; Cj为第j个聚类中心; Xp为第p个输入向量。

根据式(3)确定了到每个聚类中心的欧式距离, 选择欧式距离最近的聚类中心, 此时有两种情况: 当dη, 把新输入向量归入该聚类中心, 并计算该聚类中心总输入向量的平均值, 对中心进行更新。当d > η, 把新输入向量作为新增聚类中心。当所有向量输入后, 动态K-means聚类算法结束, 各聚类中心确定。

1.2.3 粒子群最优化算法

受到鸟群觅食行为的规律启发, Kennedy和Eberhart于1995年建立了一个简化算法模型, 经过多年改进最终形成了粒子群优化算法(Particle Swarm Optimization, PSO), 也可称为粒子群算法[33]。假设在D维搜索空间中, 有N个粒子, 每个粒子代表一个解, 则第i(1≤iN)个粒子信息为:

i个粒子空间位置: Xid = (xi1, xi2, $ \cdots $, xiD);

i个粒子速度(是矢量, 包含粒子移动的距离和方向): Vid = (vi1, vi2, $ \cdots $, viD);

i个粒子搜索到的最优位置(个体最优解): Pid, pbest= (pi1, pi2, $ \cdots $, piD).

通过优化目标函数计算每个粒子的适应值, 由适应值确认个体最优解Pid, pbest和群体最优解Pd, gbest = (p1, gbest, p2, gbest, $ \cdots $, pD, gbest), 并根据判断条件决定是否按照式(4)、(5)来更新粒子的速度和空间位置:

$ v_{id}^{k + 1} = \omega v_{id}^k + {c_1}{\gamma _1}\left( {p_{id, {\text{pbest}}}^k - x_{id}^k} \right) + {c_2}{\gamma _2}\left( {p_{d, {\text{gbest}}}^k - x_{id}^k} \right) , $ (4)
$ x_{id}^{k + 1} = x_{id}^k + v_{id}^{k + 1} , $ (5)

式中, k表示迭代次数; ω表示惯性权重; C1表示个体学习因子; C2表示群体学习因子; γ1, γ2表示在区间[0, 1]内的随机数, 增加搜索的随机性; vidk表示粒子i在第k次迭代中第d维的速度向量; $x_{id}^k$表示粒子i在第k次迭代中第d维的位置向量; $p_{id, \;{\text{pbest}}}^k$表示粒子i在第k次迭代中第d维的历史最优位置, 即在第k次迭代后, 第i个粒子搜索得到的最优解; $ p_{d, \;{\text{gbest}}}^k $表示群体在第k次迭代中第d维的历史最优位置, 即在第k次迭代后, 整个粒子群体中的最优解。

ω不宜为一个固定的常数[34], 因此提出了自适应调整的策略, 即随着迭代的进行, 线性地减小ω的值, 其公式为

$ \omega = {\omega _{\max }} - ({\omega _{\max }} - {\omega _{\min }})\frac{{iter}}{{ite{r_{\max }}}} , $ (6)

式中, ωmaxωmin分别表示最大和最小惯性权重; iter表示当前迭代次数; itermax表示最大迭代次数。当达到规定的最大迭代数, 或是相邻更新后, 最优解的适应值之间的误差达到指定误差范围内即停止算法优化。

1.2.4 优化RBF神经网络模型

由1.2.1节可知, 影响RBF神经网络性能的主要参数有3个: 各隐节点中心$ {\phi _i} $、各隐节点宽度σi以及各节点连接权值Wi。本文先采用动态K-means聚类算法获取各隐节点中心, 再利用PSO算法对RBF神经网络的隐节点宽度和连接权值进行优化求解, 由RBF神经网络均方根误差作为优化目标函数以计算适应值, 如下式所示

$ \text{fitness} (i) = \sqrt {\frac{1}{N}{{\sum\nolimits_{k = 1}^N {\left[ {{y_k}(i) - {{\hat y}_k}(i)} \right]} }^2}} , $ (7)

式中, fitness(i)表示第i个粒子自适应值, N表示输入样本数量, yk(i)表示第i个粒子的实测值, $ {\hat y_k}(i) $表示第i个粒子预测值。当迭代停止, 自适应值最小, 训练得到的各隐节点宽度σi以及各节点连接权值Wi最优。优化RBF反演模型流程图如图 5所示。

图 5 优化RBF反演模型流程 Fig. 5 The flow-chart of optimizes the RBF model
2 结果与分析

将处理好的52组数据分为两组, 随机选取35组作为建模数据, 剩余17组作为验证数据。经1.1.3节分析可知, 优化RBF模型选取B2、1/B2、1/B3、B2-B4作为模型输入层; 输出层为对应采样点的叶绿素a浓度值。设置粒子群规模N为50, 迭代次数k为1 000, 学习因子C1 = C2 = 2, 惯性权重ωmax = 0.9, ωmin = 0.2; 隐节点中心和数目由动态K-means聚类算法自动获取, 预设距离限值η为10–2时优化的RBF反演模型最佳。

为了深入展示优化RBF模型的优势, 使用同一组建模数据建立传统经验模型(表 5)和传统RBF神经网络模型, 并分别与17组验证数据进行误差分析。结果如图 6所示, 从决定系数(R2)来看, 优化RBF模型最高, 为0.90, 其次是自然对数模型的0.75, 传统RBF模型的决定系数最小, 为0.38; 从均方根误差(RMSE)来看, 优化RBF模型最小, 为0.23 μg∙L–1, 自然对数模型的0.61 μg∙L–1和传统RBF模型的0.89 μg·L–1均大于优化RBF模型。实测值与不同模型预测值的误差分析中(表 6), 优化RBF模型的平均相对误差(MRE)为11.12%, 其中相对误差低于20%有14个, 占总验证数据的82.35%; 自然对数模型和传统RBF模型的平均相对误差为33.94%和42.82%, 其中, 相对误差低于20%的自然对数模型有9个, 占总验证数据的52.94%, 传统RBF模型有6个, 占总验证数据的32.59%。

表 5 基于Sentinel-2 MSI叶绿素a浓度传统经验反演模型 Tab. 5 The traditional empirical inversion model for estimating chlorophyll a concentration using Sentinel-2 MSI data
数据 反演波段(x) 名称 模型方法 决定系数
Sentinel-2 B2-B4 e指数 y = 0.659 4e442.43x 0.41
自然对数 y = 2.580 2ln(x) + 18.398 0.68
一元二次 y = –213 521x2 + 2 425x – 1.594 6 0.66

图 6 各模型反演值和实测值(单位: μg·L–1)精度比较 Fig. 6 Comparison of accuracy between inversion values and measured values (unit: μg·L–1) of each model

表 6 实测值与不同模型预测值的误差分析 Tab. 6 Error analysis between measured values and predicted values of different models
采样编号 实测值/(μg∙L–1) 预测值/(μg·L–1) 相对误差/%
优化RBF模型 自然对数模型 传统RBF模型 优化RBF模型 自然对数模型 传统RBF模型
6 1.8 2.62 3.20 3.59 45.42 77.97 99.27
27 2.8 2.98 2.72 3.10 5.96 2.77 10.80
14 2.1 2.19 2.37 3.49 4.37 12.77 66.13
25 0.9 1.03 1.83 1.66 14.13 103.68 83.96
20 0.8 0.96 0.88 0.62 20.41 9.41 22.83
33 4.1 3.94 2.89 4.05 3.80 29.57 1.20
29 3.8 3.80 3.08 1.71 0.11 18.82 54.96
12 2.5 2.37 2.16 1.98 5.13 13.42 20.92
50 3.5 3.37 3.28 3.01 3.60 6.19 14.01
19 0.7 0.78 0.79 1.56 11.93 13.22 123.36
5 1 1.11 0.63 0.40 11.33 37.06 60.45
3 1.1 1.12 0.60 1.21 1.97 45.17 9.65
37 0.9 1.06 0.57 1.00 18.22 36.15 11.61
26 1.6 1.59 1.72 1.06 0.49 7.63 33.48
45 0.5 0.67 1.00 0.39 33.64 99.40 22.34
8 1.2 1.30 1.88 0.15 8.07 57.00 87.60
30 2.7 2.71 2.88 2.55 0.44 6.72 5.43
R2 0.90 0.75 0.38
RMSE/(μg∙L–1) 0.23 0.61 0.89
MRE/% 11.12 33.94 42.82

图 7所示, 优化RBF模型和自然对数模型的验证值趋势都与实测值大致相似, 但优化RBF模型的验证值趋势与实测值更相近, 并且没有相对过高或过低的值出现, 整体反演较为平稳。而传统RBF模型只有少许点趋势相符合。无论从建模精度分析还是误差分析, 优化RBF模型反演效果优于传统经验模型和传统RBF模型。

图 7 各反演模型验证值趋势图 Fig. 7 Trend graph of verified values of each inversion model
3 讨论

基于2019—2022年香港近海海域的204幅Sentinel-2 MSI遥感影像, 运用训练好的优化RBF模型反演香港近海海域叶绿素a浓度, 其模型输入层为B2、1/B2、1/B3、B2-B4, 模型输出层为影像反演的叶绿素a浓度值。

图 8展示了香港近海海域2019—2022年多年平均叶绿素a浓度的空间分布, 近海海域整体呈现出明显的东西分布差异的特征, 最东侧和最西侧远海海域叶绿素浓度低, 中间近岸区域叶绿素浓度高, 叶绿素浓度分布存在地域性差异, 整体的反演结果低于6 μg·L–1。根据香港环境保护署官网(https://www.epd.gov.hk/epd/sc_chi/environmentinhk/water/hkwqrc/waterquality/marine-2.html)提供的2019—2022年逐年海水水质年报中把香港近海海域划分为西部、中部、东部和南部, 本文中为便于对反演结果的计算、分析, 把南部海域的南区水质管制区划入中部海域, 并参照海水水质年报中的水质管制区编号。依照划分的海域计算叶绿素a平均浓度值, 其结果如表 7所示。西部缓冲区叶绿素a浓度最高, 为4.0 μg∙L–1; 其次是东部缓冲区、牛尾海、吐露港及赤门、后海湾和将军澳较高, 都位于海湾内, 叶绿素a浓度分别为3.9、3.7、3.5、3.4和3.3 μg∙L–1; 南区和大鹏湾较低, 两个水质区内大部分海域处于远海海域, 整体叶绿素a浓度分别为3.0和2.2 μg∙L–1; 西北部叶绿素a浓度最低, 为1.8 μg·L–1。从最值来看, 叶绿素a浓度最高值出现在吐露港及赤门的海湾内部沿岸区域, 为5.3 μg∙L–1; 叶绿素a浓度最低值出现在西北部的远海海域, 为0.4 μg∙L–1。而根据前人研究, 吐露港及赤门叶绿素a浓度平均差了1.0 μg∙L–1, 牛尾海叶绿素a浓度平均差了0.5 μg∙L–1。这是由于PSO-RBF模型仅采用站点的实测值进行评估分析, 而这两个水质区范围狭窄, 遥感数据提取容易产生偏移, 并且没有综合其他位置区域进行验证分析, 这也会导反演结果与实际结果有一定误差[35]。从整体上看, 香港近海海域叶绿素a浓度整体分布从西到东呈现低-高-低的变化格局。从局部来看, 叶绿素a浓度在每一个海湾中由内湾向外海方向、从近岸到远海方向逐渐减少的空间变化规律。并且在小范围近海海域, 叶绿素a的浓度变化非常显著且变化多样。

图 8 优化RBF模型遥感反演叶绿素a浓度分布(基于审图号GS(2024)0650的地图制作) Fig. 8 Optimized RBF model for remote sensing inversion of chlorophyll a concentration distributions 注: 水质管制区: 1吐露港及赤门; 2南区; 3牛尾海; 4将军澳; 5后海湾; 6大鹏湾; 7西北部; 8西北部缓冲区; 9东部缓冲区

表 7 不同水质区年均叶绿素a浓度(单位: μg∙L–1) Tab. 7 Mean annual chlorophyll a concentration in different water quality zones (μg∙L–1)
水域位置 西部 中部 东部
经纬度范围 22°11′~22°30′N 22°9′~22°20′N 22°9′~22°33′N
113°50′~114°3′E 113°50′~114°21′E 114°10′~114°27′E
水质管制区 7 5 8 2 9 4 3 1 6
叶绿素浓度/(μg∙L–1) 1.8 3.4 4.0 3.0 3.9 3.3 3.7 3.5 2.2
叶绿素浓度最大值/(μg∙L–1) 4.1 4.2 4.7 4.1 4.4 4.6 4.7 5.3 4.1
叶绿素浓度最小值/(μg∙L–1) 0.4 0.7 2.5 1.0 3.4 3.1 2.1 1.9 0.6
注: 水质管制区: 1吐露港及赤门; 2南区; 3牛尾海; 4将军澳; 5后海湾; 6大鹏湾; 7西北部; 8西北部缓冲区; 9东部缓冲区

就香港近海海域叶绿素a浓度整体分布从西到东呈现低-高-低的变化格局, 可能是因为西部的西北部水质控制区虽然受到珠江入流影响, 但是该区域水体交换较为迅速且陆源污染较少, 因此, 叶绿素a浓度整体上最小。对于西部的后海湾水质管制区, 中部的西部缓冲区、东部缓冲区和将军澳, 以及东部的牛尾海和吐露港及赤门水质管制区, 由于其海湾的地理环境且靠近城市, 海水中长期存在生活污水、工业废水等, 且水体交换较深圳湾控制区弱, 因此叶绿素a浓度升高。东部海域内部的牛尾海区以及吐露港与赤门海峡区是半封闭海湾, 尤其吐露港与赤门海峡区的“瓶颈状”地貌使其水体交换非常弱[36-37], 导致叶绿素a浓度最高值常出现于该水域内, 这与前人研究结果基本一致。从局部来看, 叶绿素a浓度在每一个海湾中由内湾向外海方向、从近岸到远海方向逐渐减少, 这种变化规律反映了陆源污染对叶绿素a浓度分布的控制作用。近岸靠近城市, 水中含有大量生活污水、工业废水等高营养物质水体, 导致叶绿素a浓度升高; 而近岸到远海方向, 水体流动性逐渐增强, 与相邻海水的水体交换率提高, 减少了陆源污染物的影响, 其叶绿素a浓度也相对降低。

由于香港上空范围内符合实验要求的Sentinel-2遥感影像数据较少, 一年中大部分时间的影像数据云覆盖率高于10%, 导致获取的实验数据量较少, 这些因素都在一定程度上影响了反演精度。因此建立高精度、大样本的水质样本数据库, 对于近海水质监控是有必要的。总的来说, 优化的RBF模型基本反演出叶绿素a浓度分布规律, 具有较高的实用性, 也说明了优化的RBF模型在叶绿素a浓度反演中的应用价值。

4 结论

本文基于Sentinel-2 MSI遥感数据和香港近海海域叶绿素a浓度实测数据, 提出一种动态K-means与粒子群算法优化的RBF神经网络叶绿素a反演模型, 并与传统经验模型和传统RBF模型进行对比分析。得到以下结论。

(1) Sentinel-2 MSI传感器提供1—4波段的遥感数据信息, 对叶绿素a浓度变化相对比较敏感, 用于叶绿素a浓度遥感反演有较高的可靠性。且4个波段组合运算中, B2、1/B2、1/B3、B2-B4与叶绿素a浓度的Pearson相关性较为出色, 相关系数都超过了0.78。

(2) 在动态K-means与粒子群算法优化的RBF叶绿素a反演模型训练中表明, 建立4个输入层节点的优化RBF反演模型效果最佳, 其建模精度R2=0.90高于传统经验模型和传统RBF模型, 不同模型的误差分析中RMSE和MRE更低[RMSE=0.23(μg·L–1), MRE=11.12 %]。

(3) 基于优化的RBF模型反演香港近海海域叶绿素a浓度分布显示, 整体从西到东呈现低-高-低的空间变化格局, 局部上呈现近岸高到外海逐渐降低的现象。

利用动态K-means与粒子群算法优化RBF模型中的参数, 结果显示该方法简单有效, 对叶绿素a浓度反演的模型研究具有一定的参考价值, 同时可为其他水质参数进行遥感反演提供参考。

参考文献
[1]
曹引, 冶运涛, 赵红莉, 等. 高分六号影像在内陆水体叶绿素a反演中的应用潜力分析[J]. 地球信息科学学报, 2022, 24(3): 546-557.
CAO Yin, YE Yuntao, ZHAO Hongli, et al. Application potential analysis on chlorophyll-a retrieval for inland water based on a Gaofen-6 WFV imagery[J]. Journal of Geo-information Science, 2022, 24(3): 546-557.
[2]
BRIVIO P A, GIARDINO C, ZILIOLI E. Determination of chlorophyll concentration changes in Lake Garda using an image-based radiative transfer code for Landsat TM images[J]. International Journal of Remote Sensing, 2001, 22(2/3): 487-502.
[3]
商少凌, 洪华生. 海洋初级生产力模式与遥感应用研究进展[J]. 厦门大学学报(自然科学版), 2001, 40(3): 647-652.
SHANG Shaoling, HONG Huasheng. Ocean primary production model and algorithms for remote sensing[J]. Journal of Xiamen University(Natural Science), 2001, 40(3): 647-652.
[4]
王庆轩, 崔正国, 曲克明, 等. 海洋浮游植物初级生产力及碳生物量的检测技术研究进展[J]. 海洋科学, 2023, 47(8): 131-140.
WANG Qingxuan, CUI Zhengguo, QU Keming, et al. Advances in primary productivity and carbon biomass detection of marine phytoplankton[J]. Marine Sciences, 2023, 47(8): 131-140. DOI:10.11759/hykx20230128003
[5]
DODDS W K. Trophic state, eutrophication and nutrient criteria in streams[J]. Trends in Ecology & Evolution, 2007, 22(12): 669-676.
[6]
SHI K, ZHANG Y, SONG K, et al. A semi-analytical approach for remote sensing of trophic state in inland waters: Bio-optical mechanism and application[J]. Remote Sensing of Environment, 2019, 232: 111349. DOI:10.1016/j.rse.2019.111349
[7]
洪鑫, 于仁成, 周正熙, 等. 2000~2023年东海叶绿素a含量与赤潮发生情况的变化趋势及其影响因素分析[J]. 海洋与湖沼, 2025, 56(5): 1149-1158.
HONG Xin, YU Rencheng, ZHOU Zhengxi, et al. Variations of chlorophyll a concentrations and red tide occurrences in the east China sea from 2000 to 2023 and their related environmental factors[J]. Oceanologia et Limnologia Sinica, 2025, 56(5): 1149-1158.
[8]
周岑飞, 武昭鑫, 姜欢, 等. 1984~2023年全球湖泊叶绿素a浓度时空演化特征及影响因素分析[J]. 海洋与湖沼, 2025, 56(3): 551-568.
ZHOU Cenfei, WU Zhaoxin, JIANG Huan, et al. The spatiotemporal evolution and influencing factors of global lake chlorophyll-a concentration from 1984 to 2023[J]. Oceanologia et Limnologia Sinica, 2025, 56(3): 551-568.
[9]
郝佳雯, 刘会会, 高志强, 等. 基于机器学习的黄河口邻近海域MODIS叶绿素a浓度遥感反演[J]. 海洋学报, 2025, 47(7): 109-122.
HAO Jiawen, LIU Huihui, GAO Zhiqiang, et al. Machine learning-based remote sensing retrieval model for MODIS chlorophyll a concentration in adjacent waters of the Huanghe River Estuary[J]. Haiyang Xuebao, 2025, 47(7): 109-122.
[10]
WANG X, YANG W. Water quality monitoring and evaluation using remote-sensing techniques in China: A systematic review[J]. Ecosystem Health and Sustainability, 2019, 5(1): 47-56. DOI:10.1080/20964129.2019.1571443
[11]
沈娟, 周治刚, 张彤辉, 等. 基于Sentinel-3A的北部湾海域叶绿素a浓度遥感反演研究[J]. 遥感技术与应用, 2024, 39(1): 110-119.
SHEN Juan, ZHOU Zhigang, ZHANG Tonghui, et al. Inversion of Beibu Gulf chlorophyll a concentration based on Sentinel-3A Satellite[J]. Remote Sensing Technology and Application, 2024, 39(1): 110-119.
[12]
WANG Z, SAKUNO Y, KOIKE K, et al. Evaluation of chlorophyll-a estimation approaches using iterative stepwise elimination partial least squares (ise-pls) regression and several traditional algorithms from field hyperspectral measurements in the Seto Inland Sea, Japan[J]. Sensors, 2018, 18(8): 2656. DOI:10.3390/s18082656
[13]
GIARDINO C, BRANDO V E, DEKKER A G, et al. Assessment of water quality in Lake Garda (Italy) using Hyperion[J]. Remote Sensing of Environment, 2007, 109(2): 183-195. DOI:10.1016/j.rse.2006.12.017
[14]
翟彦放, 邱月, 陈方圆, 等. 基于遥感数据的潘阳湖水体后向散射系数反演[J]. 城市勘探, 2016(3): 71-75.
ZHAI Yanfang, QIU Yue, CHEN Fangyuan, et al. Retrieving backscattering coefficient of water body in Poyang lake using remote sensing data[J]. Urban Geotechnical Investigation & Surveying, 2016(3): 71-75.
[15]
谢旭, 陈芸芝. 基于PSO-RBF神经网络模型反演闽江下游水体悬浮物浓度[J]. 遥感技术与应用, 2018, 33(5): 900-907.
XIE Xu, CHEN Yunzhi. Retrieval of total suspended matter in the lower of Minjiang River based on PSO-RBF[J]. Remote Sensing Technology and Application, 2018, 33(5): 900-907.
[16]
GILERSON A A, GITELSON A A, ZHOU J, et al. Algorithms for remote estimation of chlorophyll-a in coastal and inland waters using red and near infrared bands[J]. Optics Express, 2010, 18(23): 24109-24125. DOI:10.1364/OE.18.024109
[17]
DALL'OLMO G, GITELSON A A, RUNDQUIST D C. Towards a unified approach for remote estimation of chlorophyll-a in both Terrestrial Vegetation and Turbid productive waters[J]. Geophysical Research Letters, 2003, 30(18): 1938.
[18]
LE C, LI Y, ZHA Y, et al. A four-band semi-analytical model for estimating chlorophyll a in highly turbid lakes: The case of Taihu Lake, China[J]. Remote Sensing of Environment, 2009, 113(6): 1175-1182. DOI:10.1016/j.rse.2009.02.005
[19]
罗婕纯一, 秦龙君, 毛鹏, 等. 水质遥感监测的关键要素叶绿素a的反演算法研究进展[J]. 遥感技术与应用, 2021, 36(3): 473-488.
LUO Jiechunyi, QIN Longjun, MAO Peng, et al. Research progress in the retrieval algorithms for chlorophyll-a, element of water quality monitoring by remote sensing[J]. Remote Sensing Technology and Application, 2021, 36(3): 473-488.
[20]
杜耀. 基于时空谱融合与深度学习的水体叶绿素a遥感反演[D]. 郑州: 郑州大学, 2022.
DU Yao. Remote sensing retrieval of chlorophyll-a in water based on spatio-temporal spectrum fusion and depth learing[D]. Zhenzhou: Zhengzhou University, 2022.
[21]
吕君伟, 刘湘南, 王晶, 等. 基于PSO-RBF神经网络的南海近岸海域悬浮物浓度遥感反演[J]. 海洋环境科学, 2013, 32(5): 669-673.
LV Junwei, LIU Xiangnan, WANG Jing, et al. Remote sensing retrieval of the suspended solid concentration in coast of South China based on PSO-RBF[J]. Marine Environmental Science, 2013, 32(5): 669-673.
[22]
季强, 侯远龙, 李有为, 等. 基于RBF的舰载火箭炮最优滑模控制[J]. 电光与控制, 2023, 30(12): 104-107, 114.
JI Qiang, HOU Yuanlong, LI Youwei, et al. RBF-based optimal sliding mode control of shipborne artillery[J]. Electronics Optics & Control, 2023, 30(12): 104-107, 114.
[23]
李静, 张涛涛, 金凯, 等. 基于时变RBF神经网络的时变非线性系统控制器设计[J]. 系统仿真学报, 2023, 35(10): 2223-2236.
LI Jing, ZHANG Taotao, JIN Kai, et al. Time-varying RBF neural network-based controller design for a class time-varying nonlinear systems[J]. Journal of System Simulation, 2023, 35(10): 2223-2236.
[24]
董舜丹, 何宏昌, 付波霖, 等. 基于Landsat-8陆地成像仪与Sentinel-2多光谱成像仪传感器的香港近海海域叶绿素a浓度遥感反演[J]. 科学技术与工程, 2021, 21(20): 8702-8712.
DONG Shundan, HE Hongchang, FU Bolin, et al. Remote sensing inversion of chlorophyll a concentration in Hong Kong coastal waters based on Landsat-8 operational land imager and Sentinel-2 multispectral imager sensors[J]. Science Technology and Engineering, 2021, 21(20): 8702-8712.
[25]
肖桂林. 基于Sentinel卫星的福建省近海岸叶绿素a浓度遥感反演研究[D]. 哈尔滨: 黑龙江大学, 2021.
XIAO Guilin. Research on remote sensing retrieval of chlorophyll a concentration in the coast of Fujian province based on Sentinel satellite[D]. Harbin: Heilongjiang University, 2021.
[26]
杜嘉, 张柏, 宋开山, 等. 松花湖水体叶绿素a含量与反射光谱特征关系初探[J]. 遥感技术与应用, 2010, 25(1): 50-56.
DU Jia, ZHANG Bai, SONG Kaishan, et al. Research on correlations between chlorophyll concentration and reflectance spectral of Songhua lake[J]. Remote Sensing Technology and Application, 2010, 25(1): 50-56.
[27]
丛丕福. 海洋叶绿素遥感反演及海洋初级生产力估算研究[D]. 北京: 中国科学院遥感应用研究所, 2006.
CONG Pifu. Oceanic chlorophyll retrieval by remote sensing and ocean primary production estimate[D]. Beijing: Institute of Remote Sensing Applications, Chinese Academy of Sciences, 2006.
[28]
浦玲伟. 基于高分影像的太湖东岸带叶绿素a浓度遥感反演研究[D]. 苏州: 苏州科技大学, 2020.
PU Lingwei. Remote sensing inversion of chlorophyll-a concentration in the eastern coastal zone of Taihu lake based on High Resolution Image[D]. Suzhou: Suzhou University of Science and Technology, 2020.
[29]
钱莉. 渤海海域赤潮监测中叶绿素浓度反演算法的研究[D]. 天津: 天津科技大学, 2014.
QIAN Li. Research on inversion algorithms of chlorophyll concentration about red tides monitoring in Bohai sea[D]. Tianjin: Tianjin University of Science and Technology, 2014.
[30]
CHEN S, COWAN C F N, GRANT P M. Orthogonal least squares learning algorithm for radial basis function networks[J]. IEEE Transaction on Neural Networks, 1991, 2(2): 302-309. DOI:10.1109/72.80341
[31]
雷升锴, 刘红阳, 何嘉, 等. 动态K-均值聚类算法在RBF神经网络中心选取中的应用[J]. 信息系统工程, 2011(6): 83-85.
[32]
李方伟, 张新跃, 朱江, 等. 基于信息融合的网络安全态势评估模型[J]. 计算机应用, 2015, 35(7): 1882-1887.
LI Fangwei, ZHANG Xinyue, ZHU Jiang, et al. Network security situational awareness model based on information fusion[J]. Journal of Computer Applications, 2015, 35(7): 1882-1887.
[33]
KENNEDY J. Particle swarm optimization[J]. Proceedings of 1995 IEEE International Conference on Neural Networks (Perth, Australia), 2011, 4(8): 1942-1948.
[34]
SHI Y, EBERHART R C. Empirical study of particle swarm optimization[C]//IEEE. Proceedings of the 1999 Congress on Evolutionary Computation-CEC99, 2002.
[35]
孙宏亮, 何宏昌, 付波霖, 等. 香港近海海域叶绿素a定量反演及时空变化分析[J]. 中国环境科学, 2020, 40(5): 2222-2229.
SUN Hongliang, HE Hongchang, FU Bolin, et al. Quantitative inversion and analysis of spatio-temporal changes of chlorophyll-a concentration in Hong Kong's coastal waters[J]. China Environmental Science, 2020, 40(5): 2222-2229.
[36]
YUNG Y K, WONG C K, BROOM M J, et al. Long-term changes in hydrography, nutrients and phytoplankton in Tolo Harbour, Hong Kong[J]. Hydrobiologia, 1997, 352(1/3): 107-115.
[37]
LEE J H W, AREGA F. Eutrophication Dynamics of Tolo Harbour, Hong Kong[J]. Marine Pollution Bulletin, 1999, 39(1/12): 187-192.