海洋科学  2018, Vol. 42 Issue (5): 92-97   PDF    
http://dx.doi.org/10.11759/hykx20161012001

文章信息

赵健, 樊彦国, 丁宁. 2018.
ZHAO Jian, FAN Yan-guo, DING Ning. 2018.
基于最小二乘与径向基函数神经网络的海平面变化预测
Sea level anomaly forecasting using least square and the radial basis function neural network
海洋科学, 42(5): 92-97
Marina Sciences, 42(5): 92-97.
http://dx.doi.org/10.11759/hykx20161012001

文章历史

收稿日期:2016-10-12
修回日期:2018-05-20
基于最小二乘与径向基函数神经网络的海平面变化预测
赵健1,2, 樊彦国1,2, 丁宁1     
1. 中国石油大学(华东) 地球科学与技术学院, 山东 青岛 266580;
2. 青岛海洋科学与技术国家实验室海洋矿产资源评价与探测技术功能实验室, 山东 青岛 266071
摘要:在对海平面变化规律进行深入分析的基础上, 应用最小二乘神经网络组合模型对海平面变化趋势进行预测; 对卫星测高海平面异常序列中的周期项及线性趋势项利用最小二乘模型进行拟合, 残差部分则采用径向基函数神经网络模型进行预测。对中国近海海域卫星测高海平面异常序列的预测表明, 连续1个月的预测精度为0.52 cm, 3个月的预测精度为0.65 cm, 证明了该组合模型在海平面变化短期预测方面的可靠性, 其在海平面变化预测领域具有较高的应用价值。
关键词海平面异常    最小二乘拟合    径向基函数神经网络    预测精度    
Sea level anomaly forecasting using least square and the radial basis function neural network
ZHAO Jian1,2, FAN Yan-guo1,2, DING Ning1     
1. School of Geosciences, China University of Petroleum (East China), Qingdao 266580, China;
2. Laboratory for Marine Mineral Resources, Qingdao National Laboratory for Marine Science and Technology, Qingdao, 266071, China
Abstract: Sea level change is characterized by nonlinear, time-varying, and highly uncertain characteristics and it is difficult to obtain satisfactory forecasts using conventional linear models. Based on a comprehensive analysis of sea level changes, we applied a least square-neutral network combined method to the short-term forecasting of sea level change using sea level anomaly (SLA) data. Periodic terms and linear trends in sea level change were fitted and extrapolated using the least square model, while the forecast of the stochastic residual terms was performed using the radial basis function (RBF) neural network model. A test of the combined model with different RBF network structures was carried out in China's offshore waters using satellite altimetry SLA data Accuracies of 1 month and 3 months' forecasts were within 0.52 cm and 0.65 cm, respectively. The results prove the reliability of the least square-neutral network combined model in short-term forecasting of sea level variability; the model has significant applicability in the field of sea level change forecasting.
Key words: sea level anomaly    least square fitting    radial basis function network    forecast accuracy    

海平面变化预测研究主要基于3种数据来源:基于物理过程与机理的气候模型、海洋卫星测高监测数据和长期验潮站观测数据[1-3]。海平面异常(sea level anomaly, SLA)由实时海平面扣除平均海平面、潮汐、大气逆压和高频风应力等后得到, 对其进行精确预报能够为海平面变化预测提供重要参考。海平面变化的区域差异以及与全球平均海平面变化速率的差异是现阶段海平面变化研究的核心问题之一[4]。对海平面变化趋势的研究中, 大多数研究者针对不同时间段, 使用不同资料获取了海平面线性上升速率, 但是仅用线性趋势很难完全反映不同海域海平面在不同时段的变化。为了提高海平面变化预测的精度, 许多学者进行了一系列的研究, 如时间序列分析、二次多项式模型、灰色模型等[5-6], 但这些模型均仅适合海平面变化数据序列在平稳的情况下, 而海平面变化具有非平稳和不确定的特点。神经网络模型由于其在非线性系统建模与优化求解方面的优势, 被广泛应用于预测控制中, 形成了各种各样的神经网络预测算法[7-11], 其中, 径向基函数神经网络(RBF)模型由于具有良好的逼近非线性模型的性能, 并能得到非常稳定的结果而得到广泛应用。文献[7]利用RBF模型对GPS卫星钟差进行预报, 证明了RBF模型在钟差预报方面的可靠性。本文利用最小二乘神经网络组合模型, 采用不同网络结构的RBF模型对卫星测高SLA残差序列进行短期预测, 得出了一些有益的结论。

1 预测方法 1.1 最小二乘模型

海平面异常信号主要由年周期项、半年周期项及线性趋势项等组成。对于这些非随机信号, 可以采用最小二乘方法进行拟合, 即t时刻海平面异常s(t)可用如下表达式来逼近[12]:

$ \tilde s(t) = {A_1}\sin ({\omega _1}t + {\phi _1}) + {A_2}\sin ({\omega _2}t + {\phi _2}) + at + b $ (1)

式(1)中, A1A2分别为周期项振幅, ϕ1ϕ2为初始相位, ab为线性趋势项的系数, 若时间t以T/P卫星的周期(约为9.9 d)为单位, 则有ω1=2π/36.83, ω2=2π/18.42。式(1)拟合结果与实际信号s(t)的残差值r(t)可表示为:

$ r(t) = s(t) - \tilde s(t) $ (2)

该残差值可利用RBF模型进行预测。

1.2 径向基函数神经网络模型

径向基函数神经网络(简称径向基网络)是一种性能良好的前馈型人工神经网络, 具有较高的运算速度和较强的非线性映射能力, 能以任意精度逼近一个非线性函数, 因此在许多领域得到了广泛应用[7]。径向基网络由输入层、隐含层和输出层3层构成, 如图 1所示。

图 1 径向基函数神经网络结构 Fig. 1 The RBF network structure

在径向基网络中, 隐含层神经元采用径向基函数作为激励函数, 通常采用高斯函数。径向基网络传递函数的原型函数为:

$ {\rm{radbas}}(x) = {{\rm{e}}^{ - {x^2}}} $ (3)

式(3)中, x为自变量。该传递函数为输入层和隐含层之间距离的映射函数, 因此该变换是非线性的。

隐含层第j个神经元输出为:

$ {\varphi _j} = {{\rm{e}}^{ - {{(\frac{{\left\| {\mathit{\boldsymbol{X}} - {\mathit{\boldsymbol{U}}_j}} \right\|}}{\delta })}^2}}} $ (4)

式(4)中, X为输入向量; Uj为隐含层第j个神经元的中心矢量; δ为径向基函数的分布密度(SPREAD), 一般根据经验值确定。

由于隐含层与输出层间的激励函数为纯线性函数, 因此输出层第k个节点输出为:

$ f({z_k}) = f\left( {\sum\limits_{j = 1}^H {{\omega _{kj}}} {y_j}} \right) = \sum\limits_{j = 1}^H {{\omega _{kj}}} {y_j} $ (5)

式(5)中, zk为输出层第k个节点; yj为隐含层第j个神经元的值; H为隐含层节点数; ωkj为隐含层第j个神经元与输出层第k个神经元相连的权值, 该值一般按照学习方法获得, 如随机选取中心法、自组织选取中心法、正交最小二乘法等[7]

1.3 精度评定

本文采用均方根误差(root mean square error, RMSE)和平均绝对误差(mean absolute error, MAE)评定SLA预测结果的精度[12]:

$ {\rm{RMSE}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{[\hat h({t_i}) - h({t_i})]}^2}} } $ (6)
$ {\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {\hat h({t_i}) - h({t_i})} \right|} $ (7)

式(6)—(7)中, h(ti)、$ \hat h({t_i}) $分别表示SLA观测值和预测值, n为待预测的观测值个数。

2 基于最小二乘RBF神经网络组合模型的海平面异常预测 2.1 研究区域与数据

本文采用的海平面异常SLA数据为法国AVISO (Archiving, Validation and Interpretation of Satellite Oceanographic)提供的格网化数据MSLA。该数据融合了T/P, Jason-1/2, ERS和ENVISAT等多颗卫星的测高资料, 采用1993—1999年间的平均海面高模型作为参考[13]。数据经过了必要的地球物理改正, 包括电离层延迟改正、对流层干湿分量改正、固体潮和海潮改正、海洋负荷潮汐改正、极潮改正、电磁偏差改正、仪器改正和反变气压计改正等。本文选用时间分辨率为7 d, 空间分辨率为0.25°×0.25°, 时间跨度为1992年9月—2012年4月的中国近海海域SLA格网数据, 范围为: 0°~45°N, 100°~140°E。对各周期的SLA数据进行空间平均, 得到该区域20年的SLA时间序列如图 2所示。

图 2 中国近海海域海平面异常时间序列 Fig. 2 Sea level anomaly time seriesof China's offshore waters
2.2 结果分析

为了能够对预测结果进行精度评定, 将图 2中的SLA序列分为两部分, 其中1992—2008年的SLA序列作为预测模型的输入数据, 2009—2012年的SLA序列则用来检验模型预测结果的精度。

2.2.1 最小二乘拟合与残差分离

以1992—2008年的SLA时间序列作为预测模型的输入数据, 利用式(1)对其进行拟合, 从信号中分离出的周期项及趋势项如图 3中红色虚线所示。

图 3 中国近海海域SLA时间序列分离出来的周期项及趋势项 Fig. 3 Periodic and trend terms separated from the original SLA signal in China's offshore waters

将周期项及趋势项从SLA序列原始信号中分离, 得到最小二乘残差项如图 4所示。由图 4可以看出, 分离出的残差项在0 cm附近波动, 分布具有随机性。

图 4 中国近海海域SLA时间序列最小二乘残差(随机项) Fig. 4 LS residuals of SLA signal in China's offshore waters
2.2.2 最小二乘RBF网络组合模型预测结果分析

选择合适的径向基网络结构对SLA预测至关重要, 针对不同的预测步长, 需要选择不同的样本长度、样本量以及样本间隔, 目前这些参数的确定还缺少理论根据, 一般依赖经验确定[7]。由于SLA数据为一维时间序列, 因此本文的RBF网络采用前N个数据预测后M个数据的模式, 即选取N个数据作为输入层向量, M个数据作为输出层向量, 再选取K个样本进行训练, 利用训练得到的最优网络结构进行预测即可得到预测值。

(1) 1个月连续预测

为了检测RBF网络对海平面异常的短期预测能力, 首先对SLA进行连续1个月预测, 设置样本长度N=5, 预测长度M=5, 约为1个月。利用1992—2008年的SLA残差项作为训练样本, 样本数K=195, 进行连续5期(约1个月)预测, 并利用2009—2012年的SLA序列检验预测结果的精度。分别选取不同的隐含层神经元数及速度参数, RBF网络训练及预测阶段精度统计如表 1所示。从表 1中可以看出, 最优RBF网络为RBF(5, 20, 5), 其速度参数为0.35, 隐含层节点数为25, 训练阶段的RMSE为0.48 cm, MAE为0.36 cm。

表 1 不同网络结构RBF模型训练及预测阶段SLA精度统计 Tab. 1 Statistics of training and testing stages with different RBF models using SLA data
模型 隐含层节点数 速度参数 RMSE/cm MAE/cm
训练阶段 预测阶段 训练阶段 预测阶段
RBF(5, 11, 5) 11 0.50 0.62 0.65 0.47 0.48
RBF(5, 8, 5) 8 0.55 0.55 0.63 0.49 0.46
RBF(5, 20, 5) 25 0.35 0.48 0.52 0.36 0.41
RBF(5, 30, 5) 30 0.45 0.51 0.58 0.39 0.42

确定出最优RBF网络后, 利用最小二乘最优RBF网络组合模型对中国近海海域SLA序列进行预测。图 5为最优组合模型训练及预测阶段SLA观测值与预测值的对比, 可以看出, 该组合模型对1个月的短期预测具有非常好的可靠性, 在预测阶段可以达到0.52 cm的预测精度。

图 5 最优组合模型训练阶段(1992—2008)及预测阶段(2009—2012)SLA观测值与预测值对比 Fig. 5 Original and forecasted SLAs of the optimal combined model during the training period from 1992 to 2008 and the testing period from 2009 to 2012

(2) 3个月连续预测

针对中国近海海域SLA残差项的3个月预测, RBF网络结构设计为:设置样本长度N=15, 预测时间为3个月, 即M=15, 按照该模型建立RBF网络, 同样利用1992—2008年的SLA残差项作为训练样本, 样本数K=195, 进行连续15期(约3个月)预测, 并利用2009—2012年的SLA序列检验预测结果的精度。分别选取不同的隐含层神经元数及速度参数, RBF网络训练及预测阶段精度统计如表 2所示。从表 2中可以看出, 3个月连续预测的最优RBF网络为RBF(15, 30, 15), 其速度参数为0.55, 隐含层节点数为28, 训练阶段RMSE为0.59 cm, MAE为0.39 cm。

表 2 不同网络结构RBF模型训练及预测阶段SLA精度统计 Tab. 2 Statistics of training and testing stages with different RBF models using SLA data
模型 隐含层节点数 速度参数 RMSE/cm MAE/cm
训练阶段 预测阶段 训练阶段 预测阶段
RBF(15, 11, 15) 11 0.50 0.68 0.77 0.43 0.41
RBF(15, 18, 15) 18 0.45 0.65 0.74 0.41 0.39
RBF(15, 30, 15) 28 0.55 0.59 0.65 0.39 0.40
RBF(15, 35, 15) 32 0.65 0.64 0.68 0.39 0.46

确定出最优RBF网络后, 同样利用最小二乘最优RBF网络组合模型对中国近海海域SLA序列进行预测。图 6为最优组合模型训练及预测阶段SLA观测值与预测值的对比, 可以看出, 该组合模型对3个月的连续预测仍有较好的可靠性, 虽然最优RBF模型网络结构相比1个月连续预测时发生了变化, 但该模型在预测阶段依然达到0.65 cm的预测精度, 证明了该组合模型对SLA序列进行连续预测的可靠性。

图 6 最优组合模型训练阶段(1992—2008)及预测阶段(2009—2012)SLA观测值与预测值对比 Fig. 6 Original and forecasted SLAs of the optimal combined model during the training period from 1992 to 2008 and the testing period from 2009 to 2012

图 5图 6表 1表 2可以看出, 利用最小二乘RBF网络组合模型对SLA序列进行预测时, 预测精度随着预测时间长度的增加有所降低, 预测3个月的精度约为0.65 cm, 而预测1个月的精度可达0.52 cm, 表明该组合模型可以有效进行SLA序列的短期预测。

3 结论

基于最小二乘拟合与残差分离, 通过设计不同网络结构的RBF模型对中国近海海域卫星测高SLA时间序列进行了连续1个月、3个月的预测。连续1个月的SLA预测精度为0.52 cm, 3个月的预测精度也能达到0.65 cm, 表明针对海平面变化残差项的短期预测, 只要构建合适的RBF网络模型, 即可得到较高精度的预测结果, 这反映出海平面变化时间序列尽管有其复杂性, 但其前后有着较强的短期相关性。高精度的海平面变化预测强调短时期内的变化特点和规律, 需要依靠多种手段的综合分析, 今后还应与近岸长期验潮站观测数据、气候变化数据等融合进行综合考虑。

参考文献
[1]
段晓峰, 许学工, 陈满春, 等. 基于长期验潮数据的海平面预测方法与案例应用[J]. 北京大学学报(自然科学版), 2014, 50(6): 1065-1070.
Duan Xiaofeng, Xu Xuegong, Chen Manchun, et al. Methodology and case study of sea level prediction based on secular tide gauge data[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(6): 1065-1070.
[2]
IPCC AR5.Climate change 2013, IPCC fifth assessment report[EB/OL].[2014-11-01]http://www.ipcc.ch/report/ar5/.
[3]
王国栋, 康建成, 韩钦臣, 等. 近代全球及中国海平面变化研究述评[J]. 海洋科学, 2014, 38(5): 114-120.
Wang Guodong, Kang Jiancheng, Han Qinchen, et al. A review on sea-level change research in global and the China Sea in recent years[J]. Marine Sciences, 2014, 38(5): 114-120.
[4]
孙文, 王庆宾, 朱志大. 联合多代卫星测高数据构建中国近海及邻域海平面异常序列[J]. 测绘学报, 2013, 42(4): 493-500.
Sun Wen, Wang Qingbin, Zhu Zhida. Sea level anomaly series in China Sea and its vicinity based on multi-generation satellite altimetric data[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(4): 493-500.
[5]
孙文, 王庆宾. 基于最小二乘与ARMA组合模型的海平面异常预报[J]. 大地测量学与地球动力学, 2012, 32(5): 91-94.
Sun Wen, Wang Qingbin. Sea level anomaly forecasting based on combined model of least square and ARMA[J]. Journal of Geodesy and Geodynamics, 2012, 32(5): 91-94.
[6]
Imani M, You R J, Kuo C Y. Caspian Sea level prediction using satellite altimetry by artificial neural networks[J]. International Journal of Environmental Science and Technology, 2014, 11(4): 1035-1042. DOI:10.1007/s13762-013-0287-z
[7]
王国成, 柳林涛, 徐爱功, 等. 径向基函数神经网络在GPS卫星钟差预报中的应用[J]. 测绘学报, 2014, 43(8): 803-807.
Wang Guocheng, Liu Lintao, Xu Aigong, et al. The Application of radial basis function neural network in the GPS satellite clock bias prediction[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(8): 803-807.
[8]
赵健, 刘展. 基于灵敏度分析的海洋油气资源BP神经网络预测模型的优化[J]. 海洋科学, 2016, 40(5): 103-108.
Zhao Jian, Liu Zhan. Structure optimization of ocean oil and gas resources via BP neural network prediction model based on sensitivity analysis[J]. Marine Sciences, 2016, 40(5): 103-108.
[9]
Li G, Shi J. On comparing three artificial neural networks for wind speed forecasting[J]. Applied Energy, 2010, 87: 2313-2320. DOI:10.1016/j.apenergy.2009.12.013
[10]
Aqil M, Kita I, Yano A, et al. Analysis and prediction of flow from local source in a river basin using a Neuro-fuzzy modeling tool[J]. Journal of Hydrology, 2007, 85(1): 215-223.
[11]
Bilgili M, Sahin B, Yasar A. Application of artificial neural networks for the wind speed prediction of target station using reference stations data[J]. Renewable Energy, 2007, 32(14): 2350-2360. DOI:10.1016/j.renene.2006.12.001
[12]
Niedzielski T, Kosek W. Forecasting sea level anomalies from TOPEX/Poseidon and Jason-1 satellite altimetry[J]. Journal of Geodesy, 2009, 83: 469-476. DOI:10.1007/s00190-008-0254-5
[13]
陈亚飞, 王晓春, 刘屹岷. 中国近海海面高度异常资料再处理[J]. 海洋科学, 2016, 40(7): 151-159.
Chen Yafei, Wang Xiaochun, Liu Yimin. Sea level anomaly reprocessing for Chinese coastal region[J]. Marine Sciences, 2016, 40(7): 151-159.