海洋与湖沼  2023, Vol. 54 Issue (6): 1573-1585   PDF    
http://dx.doi.org/10.11693/hyhz20230300074
中国海洋湖沼学会主办。
0

文章信息

高宇, 李爽, 郝鹏, 宋金宝. 2023.
GAO Yu, LI Shuang, HAO Peng, SONG Jin-Bao. 2023.
基于ST-ConvLSTM的南海海表面CO2分压的空间和时间序列预测
SPATIAL AND TEMPORAL PREDICTION OF PCO2 IN THE SOUTH CHINA SEA BASED ON ST-CONVLSTM
海洋与湖沼, 54(6): 1573-1585
Oceanologia et Limnologia Sinica, 54(6): 1573-1585.
http://dx.doi.org/10.11693/hyhz20230300074

文章历史

收稿日期:2023-03-30
收修改稿日期:2023-06-13
基于ST-ConvLSTM的南海海表面CO2分压的空间和时间序列预测
高宇, 李爽, 郝鹏, 宋金宝     
浙江大学海洋学院 浙江舟山 316021
摘要:海表面二氧化碳分压(pCO2)的未来变化趋势, 对统计评估全球碳收支以及理解全球气候变化背景下的海洋酸化现象至关重要。目前传统的海面pCO2预测方法大部分基于有限的实测数据, 然而实测数据存在着时间和地理方面的制约, 且计算成本较高。近年来, 随着时空观测数据的爆炸性增长, 基于深度学习的数据驱动模型在海表面pCO2预测方面中表现出良好的潜力。然而, 由于多种环境因素与海表面pCO2之间的关系错综复杂, 到目前为止尚无十分简单有效的相关模型来对海表面pCO2进行预测。为应对这一挑战, 利用时空卷积长短时记忆神经网络(ST-ConvLSTM)模型, 通过海面温度(sea surface temperature, SST)、海面盐度(sea surface salinity, SSS)、叶绿素a浓度(chl a)和海面pCO2数据, 预测南海的海面pCO2, 并将2019年1~12月的数据作为测试集对模型的表现进行了验证。结果显示, ST-ConvLSTM模型的预测因子均方根误差、平均绝对误差和决定系数分别为0.981 Pa、0.711 Pa和0.997。对比卷积LSTM (ConvLSTM)、随机森林和广义回归神经网络(generalized regression neural network, GRNN)三种方法, 证实本文所提出的方法在解决南海pCO2预测问题上是可靠的。
关键词ST-ConvLSTM模型    中国南海    海表面二氧化碳分压    深度学习    
SPATIAL AND TEMPORAL PREDICTION OF PCO2 IN THE SOUTH CHINA SEA BASED ON ST-CONVLSTM
GAO Yu, LI Shuang, HAO Peng, SONG Jin-Bao     
Ocean College, Zhejiang University, Zhoushan 316021, China
Abstract: Understanding the future trends in the partial pressure of carbon dioxide (pCO2) at sea surface is crucial to assess statistically the global carbon balance and ocean acidification in the context of global climate change. Most of the current traditional sea surface pCO2 prediction methods are based on limited real-world data, and require temporal and geographical constraints on the real-world data and high computational costs. In recent years, with the explosive growth of spatiotemporal observational data, data-driven models based on deep learning have shown good potential in sea surface pCO2 prediction. However, due to the complex relationship between multiple environmental factors and sea surface pCO2, there is no simple and effective relevant model in this regard so far. We deveveloped a spatio-temporal convolutional long and short-term memory neural network (ST-ConvLSTM) model to predict sea surface pCO2 in the South China Sea from sea surface temperature (SST), sea surface salinity (SSS), chlorophyll a concentration (chl a), and sea surface pCO2 data, and the model was validated using data from January to December 2019 as test set. Results show that the prediction factors, and Root Mean Square Error, Mean Absolute Error and Coefficient of Determination of the model are 0.981 Pa, 0.711 Pa, and 0.997, respectively. Among three methods of convolutional LSTM (ConvLSTM), random forest, and generalized regression neural network (GRNN), our method is most reliable in the pCO2 prediction in the South China Sea.
Key words: ST-ConvLSTM    the South China Sea    sea surface pCO2 prediction    deep learning    

随着过去几十年内工业化的推进与发展, 大气中二氧化碳等温室气体的含量急剧上升(Sabine et al, 2004; Le Quéré et al, 2009, 2010; Tyrrell, 2011; Ekwurzel et al, 2017; Wanninkhof et al, 2019), 伴随着大气中二氧化碳浓度的增加, 多组观测数据显示全球平均温度总体呈现出上升的趋势。根据美国国家航空航天局(NASA)的统计, 自1880年以来, 全球平均温度上升了约1 ℃, 而海洋作为一个重要的碳汇来吸收二氧化碳, 对全球碳循环以及气候变化有重大的影响(Falkowski et al, 2000; Le Quéré et al, 2018; Rutgersson et al, 2011; Guemas et al, 2013)。如果海洋吸收二氧化碳的能力被削弱, 将可能加速大气中二氧化碳水平的上升, 加速全球变暖的速度, 进而导致冰川融化、海平面上升、极端自然灾害等一系列连锁问题的出现。

海表二氧化碳分压(pCO2)作为全球变暖的重要指标之一, 指的是海洋表层水和大气之间的二氧化碳交换处于动态平衡时CO2的含量, 海洋吸收了大约25%的人类排放的二氧化碳, 海表二氧化碳分压的变化对于全球气候和生态系统都具有重要影响(梁文浩, 2021)。大气中的pCO2和海面上的pCO2之间的差异, 即ΔpCO2, 决定了CO2气体在海-气界面的传输方向。此外, pCO2作为海气二氧化碳通量量化过程当中的重要物理量, 对研究全球碳循环具有重要的意义。然而, 大气中的pCO2变化很小, 呈现出相对稳定的状态。因此, 海表面pCO2对于分析海洋某一海域是否为大气CO2的碳源还是碳汇具有十分重要的意义。据统计边缘海的面积约占全球海洋总面积的10%, 而作为碳汇的海域可占全球海洋总面积的10%~25% (Borges et al, 2004; Cai et al, 2006)。陆架边缘海作为连接大陆和海洋之间的纽带, 是全球海洋碳循环系统的重要组成部分(Dai et al, 2004)。中国南海作为东南亚热带地区最大的边缘海, 在当前全球气候变化的背景下, 探索南海海表pCO2的变化趋势对分析和理解南海在区域碳收支方面的作用至关重要。除此之外, 南海的生化过程较为复杂, 海面温度、盐度和浮游植物初级生产力的变化都会对海面pCO2产生重大影响(Tseng et al, 2005; Dai et al, 2009; Zhai et al, 2013)。此外, 海面pCO2通常随时间和区域的变化而变化, 具有明显的时空变化特征, 这也给南海海面pCO2的研究带来了许多困难。

为了了解低纬度边缘海域对大气CO2浓度变化所做出的贡献, 研究人员对南海的温度、盐度以及海表面pCO2进行了多个航次的现场观测研究, 对南海海表面pCO2的时空变化特征有了较为清晰的认识(Thunell et al, 1992; Takahashi et al, 2009; Pfeil et al, 2013; 李骞, 2016; Li et al, 2020)。但是, 目前主要的海面pCO2预测方法大多都是基于有限的实测资料, 而且这些资料所呈现的内容一般均会受到时间和空间的限制, 同时, 预测结果也会因所选研究方法的不同而呈现出很大的差异。鉴于卫星遥感技术在时空分辨率和覆盖范围上的进步, 以及卫星遥感海洋数据的广泛使用, 卫星遥感已经成为预测海表面pCO2的重要工具。越来越多的研究人员尝试利用传统的经验回归(即多元线性回归、多元非线性回归)、基于机器学习(即多层感知器神经网络、自组织图、广义回归神经网络、随机森林)以及主成分回归、半分析法等经验方法, 建立各大洋海表面pCO2与海洋参数遥感卫星数据的相关性, 从而实现海面pCO2的预测(Cosca et al, 2003; Lohrenz et al, 2010; Gregor et al, 2017; Fassbender et al, 2018; Chen et al, 2019; Reichstein et al, 2019; Fu et al, 2020; Krishna et al, 2020; Tu et al, 2021; Wang et al, 2021; Zhong et al, 2022)。

由于海洋生物地球化学和物理过程具有很强的非线性和动态性, 用上述方法预测海面pCO2仍然是一项非常具有挑战性的任务。随着人工智能的发展, 深度学习(deep learning, DL)在海洋学领域的应用逐渐增多, 并有望成为从区域上升到全球进行研究的重要方法。可以为海面pCO2的预测提供一种新方法。基于深度学习的预测模型并不事先明确给出物理规则, 而是让模型在卫星遥感观测数据上进行训练, 模型通过从大量的训练中学习, 从而深度学习模型可以弄清其固有的规则。以卷积神经网络(convolutional neural network, CNN)为例, 研究者们利用历史气候和海洋环境数据来训练CNN模型, 并对预测结果进行了评估, 研究发现, CNN模型可以准确地预测各种海洋要素的分布规律以及变化趋势, 并且在噪声数据的情况下也能够保持较高的精度(郝滢洁, 2017; 包兴先等, 2021; 刘鹏等; 2021; 孙东洋等, 2021; 李凌霄, 2022)。另外, 递归神经网络(recurrent neural network, RNN)也被用于建立海洋水温要素的预测模型, 研究者们使用历史数据来训练RNN模型, 并通过不同的误差函数来评估模型的性能。研究发现, RNN模型可以更准确地预测海洋水文要素, 并且能够处理时序数据(朱贵重等, 2019; 覃梦娇, 2021; 孟丁丁等, 2022)。此外, 人工智能的预测技术已经在各种预报和识别应用中取得了成功, 如降水、温度、风速、海洋涡流、巨浪等方面(Shi et al, 2015; Wang et al, 2017a; Xiao et al, 2019; Xu et al, 2019; Li et al, 2021; Hao et al, 2022, 2023a, 2023b)。虽然研究人员在尝试各种方法或建立模型方面做了很多努力, 但目前的工作(Sun et al, 2021; Wang et al, 2021; Gloege et al, 2022; Gregor et al, 2022; Joshi et al, 2022)大多仍集中在pCO2的反演和重构上, 在利用卫星遥感数据预测海面pCO2方面还存在一些问题。

海表面pCO2的时空变化有两个典型特征: 时空耦合性和地理相关性。时空耦合意味着海洋状态的观测数据同时具有时间和空间属性。地理相关性是指观测数据中存在邻域效应, 即相邻空间位置之间存在相关性。而如何同时考虑多维遥感卫星数据的时空耦合和地理相关特征, 进而深入全面地研究南海海表pCO2的时空变化, 对准确预测南海碳汇能力至关重要。

本研究探索了一种新的深度学习方法(Wang et al, 2017b), 即时空卷积长短时记忆网络(spatio-temporal convolutional long short-term memory, ST-ConvLSTM), 用于预测海表面pCO2的时空变化, 以更准确地评估未来南海海面pCO2的变化趋势。本文利用SST、SSS、chl a和海面pCO2的卫星遥感数据, 通过对模型进行优化训练, 在2019年1~12月的验证数据集上对模型进行验证。结果表明, 本文所采用的方法能够较准确地预测南海海表面pCO2的变化趋势, 且各项性能指标也优于其他基准方法。

1 实验方法

在本节中, 详细介绍了ST-ConvLSTM架构的设计思路。该模型的整体流程如图 1所示。

图 1 ST-ConvLSTM模型预测流程图 Fig. 1 Flowchart of ST-ConvLSTM model prediction
1.1 时空预测介绍

对某一海域海面pCO2的预测, 在本质上是一个时空序列预测问题, 以过去的时间序列数据为输入, 以一定量的未来时间序列数据作为输出。假设需要预测由M行和N列组成的M×N单元所代表的空间区域的海表面pCO2, 网格中的每个单元可以映射P个物理特征。

图 2所示, 一个网格点在任何时间的数据值都可以用张量表示。从时间维度的角度看, 时间长度为t的观测数据形成一个张量序列。因此, 海面pCO2的时空预测问题可以定义为用过去J个时间长度的张量序列, 来预测未来K个时间长度的张量序列, 其中f表示条件概率函数, 描述了当给定过去的观测值时, 来对未来的值进行预测, 而argmax则是用于找到使该函数取得最大值时的参数。

    (1)
图 2 将二维图像转换为三维张量 Fig. 2 Transforming 2D Image into 3D Tensor 注: M表示行数, N表示列数, P表示物理特征量

在这项工作中, 每个时间步长是一个三维张量, P = 4 (分别代表SSS、SST、chl a和海面pCO2), 网格大小为85×85。

1.2 时空长短时记忆网络

深度学习的发展, 特别是递归神经网络(RNN) (Zaremba et al, 2014)和长短期记忆模型(LSTM) (Hochreiter et al, 1997)的出现, 为时空预测提供了一些有益的解决方案。LSTM在以前的各种研究中已经证明了其在稳定性和长期依赖性方面的强大优势, 时空长短时记忆网络(spatio-temporal LSTM, ST-LSTM)作为一种特殊的RNN结构, 在LSTM各项优势的基础上更具备了良好的捕捉时空信息的能力。然而, 在预测海表面pCO2的时空序列时, 涉及到时间和空间两个维度。由于LSTM不能很好地捕捉空间信息, 而这一问题将导致空间特征信息的损失。

针对上述LSTM存在的问题, 研究人员提出了卷积LSTM (convolutional long short-term memory, ConvLSTM)模型(Shi et al, 2015)。如图 3a所示, 输入帧被送入ConvLSTM编码器-解码器网络的第一层, 未来的预测序列在第四层被创建。在这个过程中, 随着信息的逐层编码, 隐藏状态从下往上进行传递。然而, 这四层中的存储单元是相互独立的, 并且只在时域中不断更新。在这种情况下, 如图 3a中的红色和黄色方框所示, 底层将完全忽略顶层在前一个时间步骤中记忆的内容。

图 3 传统的ConvLSTM架构(a)和ST-ConvLSTM架构(b) Fig. 3 The conventional ConvLSTM architecture (a) and the ST-ConvLSTM architecture (b) 注: ConvLSTM表示卷积长短时记忆网络(convolutional long short-term memory)

然而, 如果一个稳定的模型需要从不同层次的ConvLSTM模块提取的特征中进行学习, 那么原始输入序列中的细节不应当丢失。针对上述问题, 本文所用模型当中将第四层ConvLSTM模块在时间t-1的特征信息传递给第一层ConvLSTM模块在时间t的特征信息, 如图 3b中的蓝线所示。信息首先在层与层之间向上传递, 随着时间的推移向前传递, 前一刻顶层的信息流入此刻的底层进行整合, 实现了空间信息的有效传递。

2 实验设计

在本节中, 首先介绍了研究领域和本研究中使用的数据集的来源; 然后介绍了实验中用于比较的指标和其他方法; 最后, 我们描述了实验环境。

2.1 数据来源

哥白尼计划是欧盟的地球观测计划, 用于研究我们的地球及其环境, 提供来自全球卫星和陆基、机载和海洋测量系统的大量数据。本实验中使用的所有详细数据信息列于表 1, 并基于长期气候态的年际异常场的SST、SSS以及chl a数据来计算pCO2场。更详细的数据信息可以通过以下链接访问:

表 1 数据信息 Tab. 1 Data specifications
输入参数 时间维度 空间维度 时间分辨率 空间分辨率
海表温度
海表盐度
叶绿素浓度
海表二氧化碳分压
1993~2019年 5°~26°N, 105°~126°E 月平均 0.25°×0.25°

(1) https://data.marine.copernicus.eu/product/GLOBAL_MULTIYEAR_BGC_001_029/description.

(2) https://data.marine.copernicus.eu/product/GLOBAL_REANALYSIS_PHY_001_031/description.

2.2 模型性能评估参数

我们使用以下三种措施来评估模型的性能。均方根误差(ERMS)、平均绝对误差(EMA)和决定系数(R2)。公式(2)、(3)、(4)为上述三个指标的算法。

    (2)
    (3)
    (4)

其中, n是测试样本的总数, yiy分别是yi的真实值、预测值和算术平均值。而且当ERMSEMA值越低时说明测量和预测的一致性越好, 相反, R2值越高说明预测越准确。

2.3 方法比较

广义递归神经网络(generalized regression neural network, GRNN): 径向基网络的一种变形形式。GRNN的训练过程相对简单, 只需要将训练数据输入模型, 通过径向基函数计算输入变量与其对应样本之间的距离, 并将结果反馈给模型进行参数更新。在训练完成后, GRNN可以用于预测新的输入数据。GRNN一般用于解决回归问题, 而且没有模型参数需要训练。与其他神经网络模型相比, GRNN的训练速度较快, 且在小样本问题上具有较好的表现。然而, 由于其采用的是非参数化方法, 因此在大数据集上的训练会较慢, 且容易受到噪声数据的影响。

随机森林: 一种监督性学习算法。随机森林非常简单, 容易实现, 而且计算成本低。它在分类和回归中表现出非常令人印象深刻的性能。随机森林的训练过程包括两个阶段: 随机森林的构建和随机森林的预测。而随机森林在分类和回归问题上都有广泛的应用, 并且具有很好的性能表现。它可以有效地处理高维数据、缺失数据和非线性数据。同时, 由于随机森林可以对特征的重要性进行评估, 因此它也被广泛用于特征选择和数据可视化。

ConvLSTM: LSTM的一个变种。LSTM用于解决时间序列的预测问题, 但LSTM不能很好地利用空间数据特征, 基于对LSTM的改进, ConvLSTM不仅可以建立类似LSTM的时间关系, 而且还具有类似卷积神经网络的空间特征提取能力。与传统的LSTM相比, ConvLSTM在输入数据上使用卷积操作, 可以学习到更丰富的特征, 并保留了输入数据的时空信息。同时, ConvLSTM的记忆单元也是通过卷积操作来实现的, 使得网络可以在多个时间步长之间共享权重, 从而减少了网络的参数数量。ConvLSTM在许多序列数据预测和生成任务中都表现出了很好的性能。它不仅可以处理静态数据序列, 还可以处理包含动态过程和背景的时空序列, 并且可以捕捉到序列中的时空动态信息, 使得预测和生成结果更加准确。

2.4 试验环境

所有的模型都是用Adam (Kingma et al, 2014)优化器进行训练的, 起始学习率为10−3。训练过程在10 000次迭代后停止, 所有的试验都在NVIDIA 3060 GPU上进行, 并在Pytorch (Paszke et al, 2019)中实现。试验中的其他详细参数信息列于表 2

表 2 参数设置 Tab. 2 Parameters setup
参数 设置
输入长度/步 12
输出长度/步 12
输入图像尺寸/像素 85×85
输入图像通道/个 4
卷积核尺寸/像素 3×3
隐藏单元数量/个 128, 128, 128, 128
步长/步 1
批大小/个 16
2.5 试验步骤

本研究提出的方法可以实现端到端训练, 整个计算过程不需要人工处理, 而是完全交给深度学习模型, 从学习原始数据到获得结果。端到端训练的优点是降低了计算处理的复杂性。在这项工作中, 首先, 将下载的NetCDF格式数据输入到模型中, 将数据集分为训练集(1993~2018年)和验证集(2019年); 然后, 设置模型的参数, 对模型进行迭代训练(10 000次), 通过记录损失函数的值保存最优权重; 最后, 在验证集上调用最优权重进行验证, 输出预测结果, 并输出预测指标。

3 结果与分析

在本节中, 我们进行了多组试验来评估每个模型对海面pCO2的预测效果, 然后对结果进行分析和讨论。

3.1 模型验证

在本研究中, 采用ST-ConvLSTM模型来预测南海海表面pCO2, 因为该模型可以更准确地计算出影响因素与目标变量之间的非线性关系, 而不需要明确知道函数依赖关系。SST和SSS作为与海洋环境变化高度相关的物理量, 被认为是海面pCO2的最重要影响因素, 同样, 以前的研究也表明, chl a在海面pCO2的生物活动中起着关键作用。

为了更直观地显示上述结论, 图 4显示了1993~ 2019年期间研究区域内月平均SST、SSS、chl a与海面pCO2的相关性。在图 4中, 最接近1的色条值表示强正相关, 最接近−1的色条值表示强负相关。分析可知在大多数地区的SST与海面pCO2有较强的正相关关系; 中国大陆沿海地区的SSS与海面pCO2有负相关关系, 其他地区有正相关关系; chl a与海面pCO2有负相关关系。

图 4 SST(a)、SSS(b)、chl a (c)与海面pCO2的相关系数 Fig. 4 Correlation coefficients between sea surface pCO2 and SST (a), SSS (b), or chl a (c)

当模型被训练和验证时, 数据集被分为两组: 训练集(1993~2018年)和验证集(2019年)。ERMSEMAR2被用来衡量海面pCO2预测的准确性。图 5显示了模型在训练集和验证集上的表现, 颜色表示数据密度。从图 6可以看出, 随着迭代次数的增加, 虽然指标略有波动, 但总体而言, 模型在验证集上的ERMSEMA逐渐降低, R2逐渐增加。

图 5 ST-ConvLSTM模型在预测南极洲海面的pCO2方面的表现 Fig. 5 The performance of the ST-ConvLSTM model in predicting the pCO2 of the South China Sea surface 注: a: 训练集; b: 验证集; R2为决定系数

图 6 ST-ConvLSTM模型在不同迭代的验证集上的表现 Fig. 6 Performance of the ST-ConvLSTM model on the validation set with different iterations 注: a: 均方根误差b: 平均绝对误差c: 损失值d: 决定系数

试验过程中, 在保存模型的权重时采用的是最佳减重法, 模型会根据损失值自动保存最优权重。这样做的目的是保证在模型训练完成后, 得到的模型是训练过程中的最优模型。

3.2 模型性能

为了将ST-ConvLSTM与其他方法进行对比, 在同一训练集和验证集上进行了多组试验, 以验证不同方法在海面pCO2预测中的性能, 并对试验结果进行了分析和讨论。基于不同方法在验证集上的预测性能指标如表 3所示。

表 3 模型性能对比 Tab. 3 Model performance comparison
模型 均方根误差ERMS/Pa 平均绝对误差EMA/Pa 决定系数R2
GRNN 2.964 3.499 0.104
Random Forest 3.612 4.419 −0.330
ConvLSTM 2.378 2.011 0.981
ST-ConvLSTM 0.981 0.711 0.997

表 3可以发现, 随机森林模型对南海pCO2的预测效果不佳, 其ERMSEMAR2分别为3.612 Pa、4.419 Pa和−0.330, 误差较大, 预测可靠性低。相比之下, GRNN预测南海海面pCO2的性能指标ERMS为2.964 Pa, EMA为3.499 Pa, 与随机森林相比有一定的提高; R2作为衡量预测值与真实值的拟合程度的重要参数, 但GRNN模型的R2指标仅为0.104, 仍然较低。此外, 两种方法都存在着一定的其局限性: (1) 它们容易出现过拟合(在训练集上预测效果较好, 但在验证集上预测效果较差); (2) 它们忽略了数据时空关联性的差异。

ConvLSTM模型将海面pCO2预测定义为一个时空序列预测问题。为了更好地模拟时空关系, 它将FC-LSTM的思想扩展到ConvLSTM, 并通过堆叠多个ConvLSTM层形成编码预测结构。用ConvLSTM模型预测南海海面pCO2时, 其性能指标ERMS为2.378 Pa, EMA为2.011 Pa, R2可以达到0.981, 高于GRNN和随机森林两种方法。通过改进ConvLSTM模型, ST- ConvLSTM模型对南海pCO2的预测性能指标ERMSEMA分别为0.981 Pa和0.711 Pa, 分别比ConvLSTM低58.8%和64.7%。

2019年1~12月不同方法的可视化预测结果如图 7~11所示, 它们分别为“Ground-Truth”、“ST-ConvLSTM”、“ConvLSTM”、“Random Forest”以及“GRNN”, 可以从图中更直观地看到模型的预测效果。“Ground Truth”代表输入数据的真实值, 在时空预测学习中, 有两个关键方面: 空间变化和时间变化。尽管ConvLSTM模型可以捕捉到数据的时空特征信息, 但在四层ConvLSTM结构中, 由于记忆单元是相互独立的, 信息只在同层之间传递, 底层会完全忽略上一时间步长的顶层。从表 3可以看出, 预测精度指标低于ST-ConvLSTM方法。改进后的ST-ConvLSTM方法解决了ConvLSTM模型的缺陷, 能够充分把握多维遥感卫星数据的时空耦合和地理关联特性, 能够更准确地预测整个时期的海面pCO2

图 7 真实数据时空分布特征 Fig. 7 Spatio-temporal distribution characteristics of real data

图 8 ST-ConvLSTM模型结果时空分布特征 Fig. 8 Spatio-temporal distribution characteristics of ST-ConvLSTM model results

图 9 ConvLSTM模型结果时空分布特征 Fig. 9 Spatio-temporal distribution characteristics of ConvLSTM model results

图 10 Random Forest模型结果时空分布特征 Fig. 10 Spatio-temporal distribution characteristics of Random Forest model results

图 11 GRNN模型结果时空分布特征 Fig. 11 Spatio-temporal distribution characteristics of GRNN model results

随机森林和GRNN这两种方法忽略了数据在时间和空间尺度上的特征信息, 导致海面上的pCO2预测值总是低于实际值。相关的研究工作试图使用这两种方法来反推局部地区的pCO2。但在这项工作中不再仅仅考虑一个地点, 而是更多地考虑数据的时空变化信息来对未来的pCO2变化进行合理预测。从图 10图 11中也可以看出, 即使是在迭代预报的第一和第二个月, 误差也很大, 预报的可靠性很低。

从以上结果分析得出, ST-ConvLSTM模型可以更准确地预测南海海面的pCO2, 并且与其他方法相比, ST-ConvLSTM模型在预测中国南海海面的pCO2方面显示出很大的优势。

4 结论

本研究使用SST, SSS, chl apCO2的数据建立了基于ST-ConvLSTM的pCO2预测模型, 并创建了南中国海面pCO2与纬度和经度, 时间, 温度, 盐度和叶绿素的浓度之间的关系来预测南海海表pCO2。该模型在训练和验证集上都表现出较好的结果。其中, 在验证集中, ST-ConvLSTM模型的性能指标ERMSEMAR2分别为0.981 Pa, 0.711 Pa和0.997。同时基于不同模型比较其他方法, 本研究中建立的模型在解决南海海表pCO2预测问题方面具有很大的优势。

ST-ConvLSTM模型为预测南海海表面pCO2提供了良好的结果, 但它依然存在某些缺陷。一方面, 它像“黑匣子”一样运行(Zhang et al, 2021), 输入和输出之间的运行机制不能清楚地了解, 并且很难清楚地解释每个影响因素对海面pCO2变化所带来的影响。许多影响因素可能不会彼此独立, 相反这些过程可能会共同起作用以产生对海面pCO2变化的影响。使用ST-ConvLSTM模型预测南海海表的pCO2具有广泛的应用前景。这种基于AI的海面pCO2的预测模型不仅可以应用于当前的研究区域, 还可以应用于其他海域当中。同时, 获得更多卫星遥感数据, 进一步改善了ST-ConvLSTM模型预测海面长期pCO2的能力, 并解释了每个过程的相互作用机制也是未来的研究重点。

参考文献
包兴先, 范同轩, 张敬, 等, 2021. 基于卷积神经网络的海洋平台损伤识别实验系统开发[J]. 实验室研究与探索, 40(1): 49-52, 80.
戴民汉, 翟惟东, 鲁中明, 等, 2004. 中国区域碳循环研究进展与展望[J]. 地球科学进展, 01: 120-130.
郝滢洁, 2017. 基于卷积神经网络的海洋中尺度涡旋检测算法研究[D]. 青岛: 山东科技大学: 7-8.
李凌霄, 2022. 基于卷积神经网络的海浪波高快速预报模型的设计与实现[D]. 济南: 山东大学: 25-26.
李骞, 2016. 南海海表二氧化碳分压及其影响过程分析——基于多年观测结果[D]. 厦门: 厦门大学: 111-139.
梁文浩, 2021. 东海表层二氧化碳分压及其海—气界面二氧化碳通量的数值模拟研究[D]. 南京: 南京信息工程大学: 2-8.
刘鹏, 谢春华, 安文韬, 等, 2021. 卷积神经网络在SAR遥感海岛海岸带地物信息提取中的应用综述[J]. 海洋开发与管理, 38(8): 3-10. DOI:10.3969/j.issn.1005-9857.2021.08.001
孟丁丁, 陈晓东, 季顺迎, 2022. 基于循环神经网络的海冰弯曲强度预测分析[J]. 力学与实践, 44(03): 580-589.
孙东洋, 刘辉, 张纪红, 等, 2021. 基于深度卷积神经网络的海洋牧场岩礁性生物图像分类[J]. 海洋与湖沼, 52(5): 1160-1169.
覃梦娇, 2021. 基于深度学习的海洋环境时空预测方法[D]. 杭州: 浙江大学: 45-48.
朱贵重, 胡松, 2019. 基于LSTM-RNN的海水表面温度模型研究[J]. 应用海洋学学报, 38(2): 191-197. DOI:10.3969/J.ISSN.2095-4972.2019.02.005
BORGES A V, VANDERBORGHT J P, SCHIETTECATTE L S, et al, 2004. Variability of the gas transfer velocity of CO2 in a macrotidal estuary (the Scheldt)[J]. Estuaries, 27(4): 593-603. DOI:10.1007/BF02907647
CAI W J, DAI M H, WANG Y C, 2006. Air‐sea exchange of carbon dioxide in ocean margins: A province‐based synthesis[J]. Geophysical Research Letters, 33(12): L12603.
CHEN S L, HU C M, BARNES B B, et al, 2019. A machine learning approach to estimate surface ocean pCO2 from satellite measurements[J]. Remote Sensing of Environment, 228: 203-226. DOI:10.1016/j.rse.2019.04.019
COSCA C E, FEELY R A, BOUTIN J, et al, 2003. Seasonal and interannual CO2 fluxes for the central and eastern equatorial Pacific Ocean as determined from fCO2‐SST relationships[J]. Journal of Geophysical Research: Oceans, 108(C8): 3278.
DAI M H, LU Z M, ZHAI W D, et al, 2009. Diurnal variations of surface seawater pCO2 in contrasting coastal environments[J]. Limnology and Oceanography, 54(3): 735-745. DOI:10.4319/lo.2009.54.3.0735
EKWURZEL B, BONEHAM J, DALTON M W, et al, 2017. The rise in global atmospheric CO2, surface temperature, and sea level from emissions traced to major carbon producers[J]. Climatic Change, 144(4): 579-590. DOI:10.1007/s10584-017-1978-0
FALKOWSKI P, SCHOLES R J, BOYLE E, et al, 2000. The global carbon cycle: a test of our knowledge of earth as a system[J]. Science, 290(5490): 291-296. DOI:10.1126/science.290.5490.291
FASSBENDER A J, RODGERS K B, PALEVSKY H I, et al, 2018. Seasonal asymmetry in the evolution of surface ocean pCO2 and pH thermodynamic drivers and the influence on sea‐air CO2 flux[J]. Global Biogeochemical Cycles, 32(10): 1476-1497. DOI:10.1029/2017GB005855
FU Z Y, HU L S, CHEN Z D, et al, 2020. Estimating spatial and temporal variation in ocean surface pCO2 in the Gulf of Mexico using remote sensing and machine learning techniques[J]. Science of the Total Environment, 745: 140965. DOI:10.1016/j.scitotenv.2020.140965
GLOEGE L, YAN M, ZHENG T, et al, 2022. Improved quantification of ocean carbon uptake by using machine learning to merge global models and pCO2 data[J]. Journal of Advances in Modeling Earth Systems, 14(2): e2021MS002620. DOI:10.1029/2021MS002620
GREGOR L, KOK S, MONTEIRO P M S, 2017. Empirical methods for the estimation of Southern Ocean CO2: support vector and random forest regression[J]. Biogeosciences, 14(23): 5551-5569. DOI:10.5194/bg-14-5551-2017
GUEMAS V, DOBLAS-REYES F J, ANDREU-BURILLO I, et al, 2013. Retrospective prediction of the global warming slowdown in the past decade[J]. Nature Climate Change, 3(7): 649-653. DOI:10.1038/nclimate1863
HAO P, LI S, GAO Y, 2023b. Significant wave height prediction based on deep learning in the South China Sea[J]. Frontiers in Marine Science, 9: 1113788. DOI:10.3389/fmars.2022.1113788
HAO P, LI S, SONG J B, et al, 2023a. Prediction of sea surface temperature in the South China Sea based on deep learning[J]. Remote Sensing, 15(6): 1656. DOI:10.3390/rs15061656
HAO P, LI S, YU C C, et al, 2022. A prediction model of significant wave height in the South China Sea based on attention mechanism[J]. Frontiers in Marine Science, 9: 895212. DOI:10.3389/fmars.2022.895212
HOCHREITER S, SCHMIDHUBER J, 1997. Long short-term memory[J]. Neural Computation, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735
JOSHI A P, KUMAR V, WARRIOR H V, 2022. Modeling the sea-surface pCO2 of the central Bay of Bengal region using machine learning algorithms[J]. Ocean Modelling, 178: 102094. DOI:10.1016/j.ocemod.2022.102094
KINGMA D P, BA J, 2014. Adam: A method for stochastic optimization [J]. arXiv preprint arXiv: 1412.6980.
KRISHNA K V, SHANMUGAM P, NAGAMANI P V, 2020. A multiparametric nonlinear regression approach for the estimation of global surface ocean pCO2 using satellite oceanographic data[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 13: 6220-6235. DOI:10.1109/JSTARS.2020.3026363
LE QUÉRÉ C, ANDREW R M, FRIEDLINGSTEIN P, et al, 2018. Global carbon budget 2018[J]. Earth System Science Data, 10(4): 2141-2194. DOI:10.5194/essd-10-2141-2018
LE QUÉRÉ C, RAUPACH M R, CANADELL J G, et al, 2009. Trends in the sources and sinks of carbon dioxide[J]. Nature Geoscience, 2(12): 831-836. DOI:10.1038/ngeo689
LE QUÉRÉ C, TAKAHASHI T, BUITENHUIS E T, et al, 2010. Impact of climate change and variability on the global oceanic sink of CO2[J]. Global Biogeochemical Cycles, 24(4): GB4007.
LI Q, GUO X H, ZHAI W D, et al, 2020. Partial pressure of CO2 and air-sea CO2 fluxes in the South China Sea: Synthesis of an 18-year dataset[J]. Progress in Oceanography, 182: 102272. DOI:10.1016/j.pocean.2020.102272
LI S, HAO P, YU C C, et al, 2021. CLTS-Net: a more accurate and universal method for the long-term prediction of significant wave height[J]. Journal of Marine Science and Engineering, 9(12): 1464. DOI:10.3390/jmse9121464
LOHRENZ S E, CAI W J, CHEN F Z, et al, 2010. Seasonal variability in air‐sea fluxes of CO2 in a river‐influenced coastal margin[J]. Journal of Geophysical Research: Oceans, 115(C10): C10034.
PASZKE A, GROSS S, MASSA F, et al, 2019. PyTorch: An imperative style, high-performance deep learning library [C] // Proceedings of the 33rd International Conference on Neural Information Processing Systems. Vancouver, Canada: Curran Associates Inc.
PFEIL B, OLSEN A, BAKKER D C E, et al, 2013. A uniform, quality controlled Surface Ocean CO2 Atlas (SOCAT)[J]. Earth System Science Data, 5(1): 125-143. DOI:10.5194/essd-5-125-2013
REICHSTEIN M, CAMPS-VALLS G, STEVENS B, et al, 2019. Deep learning and process understanding for data-driven Earth system science[J]. Nature, 566(7743): 195-204. DOI:10.1038/s41586-019-0912-1
RUTGERSSON A, SMEDMAN A, SAHLÉE E, 2011. Oceanic convective mixing and the impact on air‐sea gas transfer velocity[J]. Geophysical Research Letters, 38(2): L02602.
SABINE C L, FEELY R A, GRUBER N, et al, 2004. The oceanic sink for anthropogenic CO2[J]. Science, 305(5682): 367-371. DOI:10.1126/science.1097403
SHI X J, CHEN Z R, WANG H, et al, 2015. Convolutional LSTM network: A machine learning approach for precipitation nowcasting [C] // Proceedings of the 28th International Conference on Neural Information Processing Systems. Cambridge: MIT Press.
SUN H W, HE J Y, CHEN Y H, et al, 2021. Space-time sea surface pCO2 estimation in the North Atlantic based on CatBoost[J]. Remote Sensing, 13(14): 2805. DOI:10.3390/rs13142805
TAKAHASHI T, SUTHERLAND S C, WANNINKHOF R, et al, 2009. Climatological mean and decadal change in surface ocean pCO2, and net sea–air CO2 flux over the global oceans[J]. Deep Sea Research Part Ⅱ: Topical Studies in Oceanography, 56(8-10): 554-577. DOI:10.1016/j.dsr2.2008.12.009
THUNELL R C, QINGMIN M, CALVERT S E, et al, 1992. Glacial‐Holocene biogenic sedimentation patterns in the South China Sea: Productivity variations and surface water pCO2[J]. Paleoceanography, 7(2): 143-162. DOI:10.1029/92PA00278
TSENG C M, WONG G T F, LIN I I, et al, 2005. A unique seasonal pattern in phytoplankton biomass in low‐latitude waters in the South China Sea[J]. Geophysical Research Letters, 32(8): L08608.
TU Z B, LE C F, BAI Y, et al, 2021. Increase in CO2 uptake capacity in the Arctic Chukchi Sea during summer revealed by satellite‐based estimation[J]. Geophysical Research Letters, 48(15): e2021GL093844. DOI:10.1029/2021GL093844
TYRRELL T, 2011. Anthropogenic modification of the oceans[J]. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 369(1938): 887-908. DOI:10.1098/rsta.2010.0334
WANG H Z, LI G Q, WANG G B, et al, 2017a. Deep learning based ensemble approach for probabilistic wind power forecasting[J]. Applied Energy, 188: 56-70.
WANG Y B, LONG M S, WANG J M, et al, 2017b. PredRNN: Recurrent neural networks for predictive learning using spatiotemporal LSTMs [C] // Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook: Curran Associates Inc.
WANG Y J, LI X F, SONG J M, et al, 2021. Carbon sinks and variations of pCO2 in the Southern Ocean from 1998 to 2018 based on a deep learning approach[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 14: 3495-3503. DOI:10.1109/JSTARS.2021.3066552
WANNINKHOF R, PICKERS P A, OMAR A M, et al, 2019. A surface ocean CO2 reference network, SOCONET and associated marine boundary layer CO2 measurements[J]. Frontiers in Marine Science, 6: 400.
XIAO C J, CHEN N C, HU C L, et al, 2019. A spatiotemporal deep learning model for sea surface temperature field prediction using time-series satellite data[J]. Environmental Modelling & Software, 120: 104502.
XU G J, CHENG C, YANG W X, et al, 2019. Oceanic eddy identification using an AI scheme[J]. Remote Sensing, 11(11): 1349.
ZAREMBA W, SUTSKEVER I, VINYAIS O, 2014. Recurrent neural network regularization[J]. arXiv preprint arXiv: 1409.2329.
ZHAI W D, DAI M H, CHEN B S, et al, 2013. Seasonal variations of air-sea CO2 fluxes in the largest tropical marginal sea (South China Sea) based on multiple-year underway measurements[J]. Biogeosciences Discussions, 10(4): 7031-7074.
ZHANG Y, TINO P, LEONARDIS A, et al, 2021. A survey on neural network interpretability[J]. IEEE Transactions on Emerging Topics in Computational Intelligence, 5(5): 726-742.
ZHONG G R, LI X G, SONG J M, et al, 2022. Reconstruction of global surface ocean pCO2 using region-specific predictors based on a stepwise FFNN regression algorithm[J]. Biogeosciences, 19(3): 845-859.