文章信息
- 陆可潇, 王晶, 魏鑫. 2021.
- LU Ke-xiao, WANG Jing, WEI Xin. 2021.
- 基于支持向量机预测安达曼海南部内孤立波传播特性
- The prediction of internal solitary wave propagation characteristics in the southern Andaman Sea based on a support vector machine
- 海洋科学, 45(5): 31-38
- Marina Sciences, 45(5): 31-38.
- http://dx.doi.org/10.11759/hykx20201105007
-
文章历史
- 收稿日期:2020-11-05
- 修回日期:2021-01-07
海洋内波是发生在密度稳定层化的海水内部的一种波动, 其最大振幅出现在海洋内部[1]。内孤立波是一种具有大振幅、单向传播、传播速度快等特点的非线性内波[2]。内孤立波具有很强的垂向速度, 在海水营养物质的混合输送中起着重要作用[3]。由于内孤立波在传播过程中伴随着巨大的扰动, 所以对海洋石油钻井平台和潜艇航行有很大的影响。因此, 内孤立波的预测工作具有重要的现实意义。印度洋的安达曼海几十年来一直是研究内孤立波的经典区域。安达曼海的内孤立波最早是在油气勘探中发现的。1975年底和1976年初, 美国埃克森石油公司在安达曼海南部实施了为期4个月的测量计划和随后的钻井作业, 初步的测量确定了该区域存在大的内波, 观测到的内波流速高达1.8 m/s。1976年10月, 在安达曼海南部的一个4 d测量计划中也获得了内波数据。Osborne等[4]根据现场观测内波数据证实了内孤立波的存在。在安达曼海北部一名海员记录的一次特殊事件中, 内孤立波通过时, 观察到一个石油钻井平台倾斜了大约3°[5]。
人们对安达曼海的内孤立波进行了系统研究。Alpers等[6]利用SAR图像研究了安达曼海内孤立波的生成位置与大陆架的相互作用。Hyder等[5]在安达曼海用实测的潮汐来预测内孤立波的发生。安达曼群岛东北的内孤立波只出现在大潮中, 当潮差超过1.5 m时, 内孤立波发生的概率随潮差的增大而增大。Jackson[7]利用中分辨率成像光谱仪(MODIS)观测, 绘制了一张内孤立波的全球分布图, 并证明内孤立波在安达曼海非常活跃。Da Silva等[8]利用SAR图像研究了安达曼海的第一模态与第二模态内孤立波的潜在生成区域与机制。Shimizu等[9]使用高分辨率麻省理工学院通用环流模型MITgcm模拟和扩展Miles理论研究了安达曼海内孤立波斜相互作用。Sun等[10]利用MODIS影像给出了安达曼海内波的时空分布、产生源和传播特征。Raju等[11]利用MODIS和SAR图像来探测安达曼海内孤立波的潜在生成地点及其传播特性。
综上所述, 安达曼海内孤立波的研究大多集中在利用卫星图像来观测内孤立波的生成位置和时空分布, 而对于内孤立波的MITgcm数值模拟和预测研究非常少。安达曼海内孤立波多发, 可分为南部、中部和北部3个区域。因为这3个区域内孤立波大多数是由半日潮与海山相互作用产生, 机理相同, 因此只选南部为研究对象, 作为内孤立波传播预测的示范区域。运用MITgcm模式来计算内孤立波的生成和传播, 提取大量的内孤立波数据建立数据库, 建立基于支持向量机(support vector machine, SVM)的安达曼海南部内孤立波传播预测模型, 利用SAR图像检验结果表明模型是有效的。
1 数据来源与数据库建立本文使用二维MITgcm模式来模拟安达曼海南部内孤立波的生成和传播, 并从中提取数据建立数据库。模拟海域选取在安达曼海南部(6.08°N, 94.6°E~97.1°E)。MITgcm采用非静力近似模拟条件, 内部区域的水平网格分辨率为300 m(纬向), 垂直方向上的最大水深为1 448 m, 网格分为42层, 分辨率从5 m(海表面)至584 m(海底)依次递增。为避免模式内生成的内孤立波及其他波动传到边界处发生反射, MITgcm采用海绵边界条件[12]。将安达曼海的地形、温度、盐度和潮汐等数据输入到MITgcm模式中, 地形数据取自ETOPO1 Global Relief Model (2009), 地形剖面图如图 1所示。温度和盐度数据均来源于World Ocean Atlas(2013)的年平均数据, 潮汐数据来自美国俄勒冈大学开发的全球潮汐模式TPXO7.2的反演结果。
安达曼海内孤立波生成被广泛认为是潮地相互作用机制。通过全球潮汐模式TPXO7.2获得安达曼海13个分潮的速度纬向分量, 如表 1所示。从表 1中可以看出半日频率的正压潮在此地区占主导地位。因此采用4个半日潮(M2、S2、N2、K2)驱动MITgcm模型。把每天的潮汐速度作为初始强迫场输入到MITgcm模型中, 得到每个潮汐下的内孤立波的产生和传播过程。本文运用MITgcm模拟计算了潮汐速度0.05~0.1 m/s时的内孤立波生成与传播, 提取了7 584条内孤立波的到达时间、位置和振幅。建立了潮汐速度振幅、经度、纬度、水深、时间和振幅6个参量建立数据库, 把数据库的数据进行随机排序, 如表 2所示。运用数据库中不同的参量建立不同的模型, 来预测内孤立波的传播时间、到达位置和振幅。
潮汐种类 | 潮汐分量 | 潮汐速度振幅/(10–2 m·s–1) |
半日潮 | M2 | 5.991 9 |
S2 | 3.176 7 | |
N2 | 1.516 6 | |
K2 | 0.803 6 | |
全日潮 | K1 | 1.061 9 |
O1 | 0.325 4 | |
P1 | 0.369 4 | |
Q1 | 0.017 2 | |
其他混合潮 | Mf | 0.005 1 |
Mm | 0.000 5 | |
M4 | 0.016 0 | |
MS4 | –0.000 1 | |
MN4 | 0.000 6 |
序号 | 潮汐速度振幅/(10−2 m·s–1) | 东经/(°) | 北纬/(°) | 水深/m | 时间/h | 振幅/m |
1 | 8.12 | 95.67 | 6.08 | –1 335 | 6.22 | 32.01 |
2 | 9.45 | 96.65 | 6.08 | –1 333 | 34.19 | 72.58 |
3 | 10.08 | 96.25 | 6.08 | –1 343 | 27.75 | 78.45 |
…… | …… | …… | …… | …… | …… | …… |
7582 | 10.29 | 95.77 | 6.08 | –1 303 | 9.69 | 62.60 |
7583 | 5.70 | 96.36 | 6.08 | –1 344 | 39.67 | 28.37 |
7584 | 7.40 | 96.67 | 6.08 | –1 330 | 37.04 | 63.55 |
运用支持向量机和大量的模拟数据建立安达曼海南部内孤立波传播预测模型。通过模型来预测内孤立波的传播过程, 包括传播时间、位置和振幅。把数据库中的7 584个模拟数据分为两部分, 75%为训练数据(序号1~5688), 25%为检验数据(序号5689~7584)。为衡量模型预测的性能, 采用相关系数R(correlation coefficient), 平均绝对误差MAE(mean absolute error)和平均绝对百分比误差MAPE (mean absolute percentage error)作为模型的评价指标。上述评价指标R值越大, MAE和MAPE值越小, 则预测效果越好。其表达式如下:
$R=\frac{\sum\limits_{i=1}^{n}\left[\left(y_{\text {true }}(i)-\bar{y}_{\text {true }}\right)\left(y_{\text {pred }}(i)-\bar{y}_{\text {pred }}\right)\right]}{\sqrt{\sum\limits_{i=1}^{n}\left(y_{\text {true }}(i)-\bar{y}_{\text {true }}\right)^{2} \sum\limits_{i=1}^{n}\left(y_{\text {pred }}(i)-\bar{y}_{\text {pred }}\right)^{2}}}, $ | (1) |
$M_{\text {AE }}=\frac{1}{n} \sum\limits_{i=1}^{n}\left|y_{\text {true }}(i)-y_{\text {pred }}(i)\right|, $ | (2) |
$M_{\text {APE }}=\frac{1}{n} \sum\limits_{i=1}^{n}\left|\frac{y_{\text {true }}(i)-y_{\text {pred }}(i)}{y_{\text {true }}(i)}\right| \times 100 \%.$ | (3) |
式中: n为预测个数, ytrue为真实值, ypred为模型预测值。
支持向量机(support vector machine, 简称SVM)由Cortes和Vapnik于1995年正式提出[13]。它是一种基于统计学习理论的有监督机器学习方法, 被广泛地运用在模式识别、函数拟合和时间序列估计等领域, 进行数据分类[14]、回归和预测[15-16]研究。本文采用的SVM参数有: SVM设置类型(-s), 核函数(-t), 惩罚系数(-c), 核函数中的gamma函数(-g), epsilon-SVR中的损失函数(-p)。
2.1 内孤立波时间预测模型把内孤立波到达位置的经度、水深和潮速振幅3个参量作为模型输入参量, 内孤立波到达时间作为模型输出。内孤立波时间预测模型确定SVM设置类型-s 4, nu-SVR是支持向量回归机, 由于epsilon-SVR需要事先确定参数, 然而在某些情况下选择合适的参数却不是一件容易的事情, 而nu-SVR能够自动计算参数。经过多次试验和对比验证, 确定核函数设置类型-t 0, 线性核函数主要用于线性可分的情形。参数少, 速度快, 对于一般数据, 预测效果比较理想。
对时间预测模型检验结果绘制成时间数据散点图和偏差概率图, 并计算散点图的相关系数、平均绝对百分比误差及平均绝对误差, 如图 2所示。通过两者比较可以得知基于SVM的内孤立波时间预测模型的MAPE为1.17%, MAE为0.22 h。从图 2中可以看出数据点在散点图中分布比较集中, R为0.999 5, 相关度较高。时间数据偏差在0 h附近的数据出现概率最高, 主要集中在–0.4 h到0.4 h之间, 出现概率为0.893, 预测效果较理想。
2.2 内孤立波位置预测模型把时间、水深和潮速振幅3个参量作为模型输入, 到达位置的经度作为模型输出。内孤立波位置预测模型和时间预测模型的设置是一样的, SVM设置类型-s 4, 核函数设置类型-t 0。经过多次试验和对比验证, 这个设置不仅适合于时间预测, 也同样适合于到达位置预测。模型检验结果的时间数据散点图和偏差概率图如图 3所示。通过两者对比可以得出基于SVM的内孤立波位置预测模型的MAPE为0.016%, MAE为0.015°。从图 3中可以看出虽然有个别数据点分散, 但是大部分数据点在散点图中分布较为集中, 相关系数R为0.999 1, 相关度较高。经度数据偏差在–0.01°附近的数据出现概率最高, 主要集中在–0.02°到0.03°之间, 出现概率为0.865, 预测结果比较好。
2.3 内孤立波振幅预测模型把时间、经度、水深和潮速振幅4个参量作为模型输入, 振幅作为模型输出。内孤立波振幅预测模型确定SVM设置类型-s 3, epsilon-SVR对应不敏感损失函数ε的支持向量回归机, 对样本点来说, 存在着一个不为目标函数提供任何损失值的区域。经过多次试验和对比验证, 确定epsilon-SVR中的损失函数p=0.05, 核函数设置类型-t 2, RBF核函数因为其追踪性能好且无记忆性, 通过调节核参数更能反映训练数据的范围分布, 预测效果较好。通过多次参数寻优得到惩罚系数Cbest=0.031 25, RBF核函数中的gamma函数gbest=8。
检验模型结果见绘制时间数据散点图和偏差概率图, 并计算散点图的相关系数、平均绝对百分比误差及平均绝对误差, 如图 4所示。通过计算得出基于SVM的内孤立波振幅预测模型的MAPE为10.00%, MAE为3.88 m。从图 4中可以看出数据点在散点图中分布有点分散, 但是整体上是较为集中的, R=0.975 8, 相关度较高。数据偏差在0 m附近的数据出现概率最高, 数据偏差比较分散, 主要集中在–8 m到8 m之间, 出现概率为0.886, 预测结果是可以接受的。
3 模型经度验证在安达海南部海域(5°N~7°N, 94°E~100°E), 收集了2018全年的Sentinel-1A SAR图像。在所有的图像中总共筛选出3景匹配的图像, 如图 5所示。
从3景图像中选择5条明显的内孤立波, 确定其位置后, 通过ETOPO1获得红点位置的水深, 通过TPXO7.2获得内孤立波生成源处的潮速振幅, 如表 3所示。运用SVM把7 854个模拟数据作为训练集进行模型训练, 然后运用训练好的模型来预测图像中的传播时间、位置和振幅, 最终把预测数据与SAR图像数据做对比。
序号 | 图像编号 | 北纬/(°) | 东经/(°) | 水深/m | 生成源潮速振幅/(10–2 m·s–1) |
1 | S1A_IW_GRDH_1SDV_20180414T1151 | 6.081 | 95.96 | 1 343 | 7.55 |
2 | S1A_IW_GRDH_1SDV_20180414T1151 | 6.081 | 96.86 | 1 274 | 6.68 |
3 | S1A_IW_GRDH_1SDV_20180520T1151 | 6.081 | 95.77 | 1 330 | 7.22 |
4 | S1A_IW_GRDH_1SDV_20180321T1151 | 6.080 | 95.90 | 1 346 | 9.82 |
5 | S1A_IW_GRDH_1SDV_20180321T1151 | 6.080 | 96.87 | 1 274 | 10.05 |
把经度、水深和潮速振幅3个参量作为模型输入, 时间作为模型输出。通过SVM的内孤立波时间预测模型, 得到时间预测数据, 如表 4所示。图 6是SVM预测的时间数据和图像时间数据对比图。圆形代表通过SVM时间预测模型预测的时间数据, 正方形代表SAR图像的时间数据。通过比较可得, SVM模型预测的时间数据和SAR图像时间数据的MAPE为8.43%, MAE为1.00 h。
序号 | SVM预测时间数据 (世界时) | SAR图像时间数据 (世界时) |
1 | 10.49 | 11.85 |
2 | 11.28 | 11.85 |
3 | 12.02 | 11.85 |
4 | 12.48 | 11.85 |
5 | 14.11 | 11.85 |
3.2 内孤立波位置预测模型结果
本文把时间、水深和潮速振幅3个参量作为模型输入, 经度作为模型输出。表 5显示了基于SVM的内孤立波位置预测模型的经度预测数据和SAR图像经度数据。经度预测数据和图像经度数据对比图如图 7所示。从图 7可以得出, 圆形代表通过SVM模型得到的预测经度数据, 正方形代表SAR图像经度数据。通过对比得知, SVM模型预测经度和SAR图像经度的MAPE为0.072%, MAE为0.069°。图 7中的两条曲线拟合程度较好, 预测结果较理想。
序号 | SVM预测内孤立波位置经度(东经) | SAR图像内孤立波位置经度(东经) |
1 | 96.05° | 95.96° |
2 | 96.90° | 96.86° |
3 | 95.76° | 95.77° |
4 | 95.85° | 95.90° |
5 | 96.71° | 96.87° |
3.3 内孤立波振幅预测模型结果
把时间、经度、水深和潮速振幅4个参量作为模型输入, 振幅作为模型输出。通过SVM的内孤立波振幅预测模型, 得到振幅预测数据, 如表 5所示。SVM振幅预测数据的最大振幅为84.98 m, 最小振幅为23.80 m, 平均振幅为56.26 m。从表 6中可以看出, SVM振幅预测数据的最大值在农历二月初五。这一天的潮汐速度最大, 并且内孤立波经度也最大。SVM振幅预测数据的最小值在农历四月初六。这一天的潮汐速度较小, 而且内孤立波经度最小。由于没有与遥感数据相匹配的现场实测数据, 所以将SVM振幅预测的结果与历史的实测数据进行对比。Osborne等[4]在安达曼海南部1 093 m深的水域, (6°53′N, 97°04′E)位置处测量到振幅为60 m的内孤立波。实测位置和预测位置接近, 预测的平均振幅和实测振幅差距较小, 所以内孤立波振幅预测结果是合理的。
序号 | 日期 | SVM振幅预测数据/m | 东经/(°) | 生成源潮速振幅/(10–2 m·s–1) |
1 | 农历二月二十九 | 48.36 | 95.96 | 7.55 |
2 | 农历二月二十九 | 59.40 | 96.86 | 6.68 |
3 | 农历四月初六 | 23.80 | 95.77 | 7.22 |
4 | 农历二月初五 | 64.96 | 95.90 | 9.82 |
5 | 农历二月初五 | 84.98 | 96.87 | 10.05 |
本文提出了一种基于机器学习来预测内孤立波传播的新思路, 并建立了基于SVM的安达曼海南部内孤立波传播预测模型。首先运用全球潮汐模式TPXO7.2得到潮汐速度, 以潮汐速度为初始强迫场构造出不同潮汐速度下的MITgcm模式的内孤立波数值计算模型。通过MITgcm模拟计算了潮汐速度0.05~ 0.1 m/s的内孤立波生成与传播过程, 总共提取了7 584条内孤立波。然后把7 584个模拟数据分为两部分, 5 688个数据为训练数据, 1 896个数据为检验数据。采用SVM方法建立了安达曼海南部内孤立波传播预测模型。在模型建立的过程中, 基于SVM的内孤立波传播预测模型的时间模型的R为0.999 5, MAPE为1.17%, MAE为0.22 h。位置模型的R为0.999 1, MAPE为0.016%, MAE为0.015°。振幅模型的R为0.975 8, MAPE为10.00%, MAE为3.88 m。
然后运用Sentinel-1A的SAR图像中的数据来验证模型的准确性。通过与SAR图像对比可得, SVM模型预测的时间数据和图像时间数据的MAPE为8.43%, MAE为1.00 h。SVM模型预测的经度和图像经度的MAPE为0.072%, MAE为0.069°。SVM的振幅预测数据平均振幅为56.26 m, 历史上的实测数据振幅为60 m, 两者比较接近。因此, SVM的安达曼海南部内孤立波传播预测模型是有效的, 可为石油勘探和海洋决策部门预警提供参考。
[1] |
方欣华, 杜涛. 海洋内波基础和中国海内波[M]. 青岛: 中国海洋大学出版社, 2005: 1-4. FANG Xinhua, DU Tao. Fundamentals of oceanic internal waves and internal waves in the China seas[M]. Qingdao: China Ocean University Press, 2005: 1-4. |
[2] |
段亚男. 基于ARM嵌入式技术监测海洋内孤立波传播特征的系统设计[D]. 青岛: 青岛理工大学, 2013. DUAN Ya'nan. Designing based on ARM embedded technology to detect propagation characteristics of internal solitary waves[D]. Qingdao: Qingdao University of Technology, 2013. |
[3] |
蔺飞龙. 南海北部内波特征研究及机理分析[D]. 北京: 中国科学院大学, 2014. LIN Feilong. Characteristics and mechanism analysis of internal waves in the northern South China Sea[D]. Beijing: University of Chinese Academy of Sciences, 2014. |
[4] |
OSBORNE A R, BURCH T L. Internal solitons in the Andaman sea[J]. Science, 1980, 208(4443): 451-460. DOI:10.1126/science.208.4443.451 |
[5] |
HYDER P, JEANS D R G, CAUQUIL E, et al. Observations and predictability of internal solitons in the northern Andaman Sea[J]. Applied Ocean Research, 2005, 27(1): 1-11. DOI:10.1016/j.apor.2005.07.001 |
[6] |
ALPERS W, HENG Wangchen, LIM Hock. Observation of internal waves in the Andaman Sea by ERS SAR[J]. European Space Agency, (Special Publication) ESA SP, 1997, 414(3): 1287-1291. |
[7] |
JACKSON C. Internal wave detection using the moderate resolution imaging spectroradiometer (MODIS)[J]. Journal of Geophysical Research: Oceans, 2007, 112: C11012. DOI:10.1029/2007JC004220 |
[8] |
DA SILVA J C B, MAGALHAES J M. Internal solitons in the Andaman Sea: a new look at an old problem[C]//Proceedings of the Remote Sensing of the Ocean, Sea Ice, Coastal Waters, and Large Water Regions. Edinburgh, UK: SPIE Remote Sensing, 2016, 9999(999907).
|
[9] |
SHIMIZU K, NAKAYAMA K. Effects of topography and earth's rotation on the oblique interaction of internal solitary-like waves in the Andaman Sea[J]. Journal of Geophysical Research: Oceans, 2017, 122(9): 7449-7465. DOI:10.1002/2017JC012888 |
[10] |
SUN Lina, ZHANG Jie, MENG Junmin. A study of the spatial-temporal distribution and propagation characteristics of internal waves in the Andaman Sea using MODIS[J]. Acta Oceanologica Sinica, 2019, 38(7): 121-128. DOI:10.1007/s13131-019-1449-8 |
[11] |
RAJU N J, DASH M K, DEY S P, et al. Potential generation sites of internal solitary waves and their propagation characteristics in the Andaman Sea-a study based on MODIS true-colour and SAR observations[J]. Environmental monitoring and assessment, 2019, 191(Suppl 3): 809. DOI:10.1007/s10661-019-7705-8 |
[12] |
ZHANG Z, FRINGER O B, RAMP S R. Three-dimensional, nonhydrostatic numerical simulation of nonlinear internal wave generation and propagation in the South China Sea[J]. Journal of Geophysical Research Oceans, 2011, 116(C5): C05022. |
[13] |
CORTES C, VAPNIK V N. Support-Vector networks[J]. Machine Learning, 1995, 20(3): 273-297. |
[14] |
张锦水, 何春阳, 潘耀忠, 等. 基于SVM的多源信息复合的高空间分辨率遥感数据分类研究[J]. 遥感学报, 2006, 10(1): 49-57. ZHANG Jinshui, HE Chunyang, PAN Yaozhong, et al. The high spatial resolution RS image classification based on SVM method with the multi-source data[J]. Journal of Remote Sensing, 2006, 10(1): 49-57. |
[15] |
吴恒, 余秋鹏. 基于SVM预测电动汽车并网局部电压稳定的研究[J]. 电工电气, 2019(10): 9-13. WU Heng, YU Qiupeng. Research on prediction of local voltage stability of electric vehicles based on SVM[J]. Electrotechnics Electric, 2019(10): 9-13. DOI:10.3969/j.issn.1007-3175.2019.10.003 |
[16] |
徐娟, 卞良. 基于SVM的中文垃圾邮件预测系统研究[J]. 数字技术与应用, 2020, 38(355): 48-49. XU Juan, BIAN Liang. Research on Chinese spam prediction system based on SVM[J]. Digital Technology and Application, 2020, 38(355): 48-49. |