海洋科学  2021, Vol. 45 Issue (3): 94-107   PDF    
http://dx.doi.org/10.11759/hykx20200424004

文章信息

姜宗辰, 马毅, 杨俊芳. 2021.
JIANG Zong-chen, MA Yi, YANG Jun-fang. 2021.
基于自扩展深度置信网络的原油油膜绝对厚度反演研究
Inversion of absolute thickness of crude-oil film based on self-expanding deep belief network
海洋科学, 45(3): 94-107
Marine Sciences, 45(3): 94-107.
http://dx.doi.org/10.11759/hykx20200424004

文章历史

收稿日期:2020-04-24
修回日期:2020-05-10
基于自扩展深度置信网络的原油油膜绝对厚度反演研究
姜宗辰1,2, 马毅2,3, 杨俊芳4     
1. 山东科技大学测绘科学与工程学院, 山东 青岛 266590;
2. 自然资源部第一海洋研究所, 山东 青岛 266061;
3. 西北工业大学 空天地海一体化大数据应用技术国家工程实验室, 陕西 西安 710729;
4. 中国石油大学(华东) 地球科学与技术学院, 山东 青岛 266580
摘要:海上溢油事故危害海洋生态安全、人类健康与经济发展。开展基于遥感技术的海面溢油量的估算研究,对于保护海洋生态环境具有重要意义,而油膜厚度反演是溢油量估算的核心环节。本文通过搭建室外实验场景,模拟真实海面溢油环境,基于现场实测高光谱遥感数据,开展海面溢油厚度反演研究。本文将深度学习与遥感技术融合,提出了基于自扩展深度置信网络的油膜厚度反演模型(oil thickness inversion generative adversarial and deep belief network,OG-DBN)。该模型由油膜光谱特征数据自扩展模块与油膜绝对厚度反演模块两部分组成。光谱特征数据自扩展模块能够基于实测高光谱遥感数据,自动筛选出光谱可分性较好的光谱特征区间,进而基于对抗生成网络(generative adversarial network,GAN)进行样本扩展,增强模型的泛化性;油膜绝对厚度反演模块则是基于深度置信网络(deep belief network,DBN),深度挖掘不同厚度油膜光谱特征数据的光谱特性信息,精确反演油膜的绝对厚度。实验结果表明,本文提出的OG-DBN模型在可控实验条件下,原油油膜绝对厚度反演精度达到97.69%,决定系数R2为0.980,平均差控制在±0.06%;模型鲁棒性测试表明,该模型仍能保持较为稳定的反演精度,均高于93.33%,R2大于0.957以上,平均差在±0.6%以内。
关键词海洋遥感    原油油膜    绝对厚度    深度学习    深度置信网络    生成对抗网络    
Inversion of absolute thickness of crude-oil film based on self-expanding deep belief network
JIANG Zong-chen1,2, MA Yi2,3, YANG Jun-fang4     
1. College of Geomatics, Shandong University of Science and Technology, Qingdao 266590, China;
2. First Institute of Oceanography, Ministry of Natural Resources, Qingdao 266061, China;
3. National Engineering Laboratory for Integrated Aero-Space-Ground-Ocean Big Data Application Technology, Northwestern Polytechnical University, Xi'an 710729, China;
4. School of Geosciences, China University of Petroleum (East China), Qingdao 266580, China
Abstract: Marine oil spills seriously endanger marine ecological security, human health, and economic development. Thus, to protect the marine ecological environment, it is very important to carry out research into the estimation of marine oil spillages using remote-sensing technology. The thickness inversion of an oil film is the key indicator for the estimation of oil spill volume. We set up an outdoor experimental site to simulate real oil spills on a sea surface and, by using field-measured hyperspectral remote-sensing data, we study the thickness inversion of sea oil spills. In this paper, we combine deep learning with remote-sensing technology and propose an oil-thickness-inversion generative adversarial and deep belief network (OG-DBN) model. The model consists of a self-expanding module for the oil film's spectral feature data and a module for the oil-film thickness inversion. The self-expanding module can automatically select spectral feature intervals with good spectral separability based on the measured hyperspectral remote-sensing data and then expand the number of samples using a generative adversarial network (GAN) to enhance the generalization of the model. The oil-film-thickness-inversion module is based on a DBN. It extracts the characteristics of the spectral feature data of oil films with different thicknesses, and then accurately inverts the oil film's absolute thickness. The results show that the accuracy of absolute oil thickness inversion for the OG-DBN model proposed in this paper can reach 97.69%, the determination coefficient (R2) can reach 0.980, and the mean deviation remains within ±0.06% under controlled experimental conditions. In the model stability test, the model maintains relatively stable inversion results. The accuracy of the oil-film thickness inversion remains above 93.33%, R2 remains above 0.957, and the mean deviation is controlled within ±0.6%, which indicates excellent robustness.
Key words: ocean remote sensing    crude-oil film    absolute thickness inversion    deep learning    DBN    GAN    

伴随着全球海上运输业及海洋石油开采业的迅速发展, 海上溢油事故频发, 严重影响海洋生态环境与海洋资源的可持续发展[1-2]。海面溢油量是评价海上溢油事故威胁程度和确定事故等级的重要指标, 也是污染赔偿追责的法律依据, 同时对于现场溢油应急处置和科学决策也有重要作用。溢油范围、油膜厚度与溢油密度的准确获得是评估溢油量的基础。其中, 溢油密度相对稳定, 随着高分辨率遥感技术的发展, 溢油范围的确定也不再是难题, 而油膜绝对厚度的遥感反演仍是当前研究的热点与难题。

国内外溢油监测业务应用主要以合成孔径雷达(synthetic aperture radar, SAR)遥感数据为主, 但SAR数据受低风速区与厚云雨层等“类油膜”现象影响严重, 且无法应用于油膜厚度的精确反演[3-4]; 紫外探测手段常被应用于甚薄油膜的探测, 但该方法受太阳耀斑与海洋生物等因素干扰严重[5-6]; 激光探测具备全天候、全气象监测的特点, 可以基于拉曼荧光效应对油膜厚度进行反演, 但仅限于较薄油膜的测定[7]。目前油膜厚度评定采用的标准是国际海事组织认可的Bonn协议, 该协议给出了油膜颜色与厚度的定性对应关系, 如油膜目视特征表现为银灰色时, 其对应的厚度为0.02~0.05 μm。该协议应用存在的主要问题是不同颜色油膜的鉴别工作受主观因素和环境因素影响较大; 此外, Bonn协议针对大于100 μm的厚油膜无法进行精细的区分。近年来, 高光谱遥感技术的发展为定量反演海面油膜绝对厚度提供了技术基础; 现阶段原油油膜绝对厚度实验数据大多在可控试验下获取且数据量有限[8-9], 而油膜绝对厚度的反演需要大量数据的支持。

深度学习作为信息领域中的新兴前沿方向发展迅速[10-12], 生成对抗网络(generative adversarial networks, GAN)由生成网络(generator network, G)和判别网络(discrimination network, D)两个网络构成, G与D通过互相对抗的过程可以生成高质量仿真数据[13-14]。深度置信网络(deep belief network, DBN)兼具正向无监督式学习与反向监督式微调的特点, 在深度挖掘实验数据特征信息的同时能够有效地避免训练过程中易出现的过拟合现象[15]。与现有方法相比, 本文提出的OG-DBN模型只需要基于少量实测数据便可生成大量高仿真数据, 大大降低实验成本, 提高实验效率; 与传统遥感反演建模方法不同, 该方法能够充分学习光谱特征区间内的高光谱信息, 避免了有效光谱信息的损失。因此, 将深度学习与遥感技术结合, 应用于原油油膜绝对厚度反演, 能够提高反演精度。

1 数据获取与处理 1.1 实验数据获取

本次实验时间是2019年11月8日, 实验地点为自然资源部第一海洋研究所崂山所区, 实验油品为东营胜利油田的原油, 由于实验观测时间较短, 故不考虑原油乳化情况。本次实验使用ASD-FieldSpec4地物光谱仪开展室外油膜厚度光谱测量, 实验所获取的光谱范围为350~2 500 nm, 其中350~1 000 nm范围内的光谱分辨率为3 nm, 1 000~2 500 nm范围内的光谱分辨率为7 nm。观测时, 光谱仪的视场角默认为25°, 于海水表面之上10 cm高度处进行测量, ASD-FieldSpec4地物光谱仪仪器参数如表 1所示。

表 1 ASD-FieldSpec4地物光谱仪参数 Tab. 1 Parameters of the ASD-FieldSpec4 ground object spectrometer
名称 参数
光谱范围/nm 350~2 500
光谱分辨率/nm 3(350~1 000), 7(1 000~2 500)
光谱采样间隔/nm 1.4(350~1 000), 1.1(1 000~2 500)
输入/m 1.5(25°视场)
波长精度/nm 0.5
波长重复性/nm 0.1

实验中, 通过向储物箱内添加海水, 并于储物箱底部添加沙子, 模拟真实海洋环境; 将12根内径为6 cm的亚克力管置于已添加海水的储物箱中并固定, 用作围隔装置, 防止油膜的无规则扩散。分别标注容器1至容器12, 实验容器1内的纯净海水作为对照实验组。由于本次实验时间为冬季, 原油不易均匀扩散, 因此使用加热棒对海水进行加热, 并对油膜进行轻微搅拌, 加快油膜扩散速度, 待油膜完全扩散, 保证油膜均匀覆盖实验容器, 实验水体冷却至常温再进行观测, 实验场景如图 1所示。

图 1 实验观测场景 Fig. 1 Experimental observation setup diagram

本次实验在布置原油前首先进行了原油精确密度测量工作, 我们在测量开始前使用高精度电子秤称重空烧杯质量, 使用滴管向已知容积的烧杯(100 mL)内添加原油, 称重添加原油后烧杯质量, 基于液体密度公式, 如式(1)所示, 获取实验所用原油的精确密度。

$ \rho_{\mathrm{Oil}}=\frac{m_{\mathrm{A}}-m_{\mathrm{B}}}{V_{\mathrm{B}}}, $ (1)

其中, ρOil代表实验所用原油的精确密度, mB空烧杯质量, mA代表加入原油后烧杯的质量, VB代表烧杯的体积。

本次实验在添加原油前使用高精度电子秤对空滴管进行了去皮处理。我们使用高精度滴管吸取原油, 测量此时滴管的质量, 向实验容器2内添加原油, 滴管滴入时距离水面10~15 cm, 滴入点保持位于实验容器水面中心点附近, 在滴入操作后再次称重, 获取滴入实验容器内原油的精确质量。待油膜完全扩散, 基于原油密度测量实验所获得的原油精确密度, 计算滴入实验容器内原油的准确体积; 根据实验所用亚克力管内径长度, 计算实验容器2中油膜的厚度, 如式(2)所示。重复上述实验操作, 计算实验容器3至容器12中的原油油膜厚度。

$ {h_{{\rm{Oil}}}} = \frac{{{m_{\rm{a}}} - {m_{\rm{b}}}}}{{{\rm{ \mathsf{ π} }} \cdot {\rho _{{\rm{Oil}}}} \cdot {r^2}}}, $ (2)

其中, ma代表吸取原油后滴管的质量, mb代表向实验容器内添加原油后滴管的质量, ρOil代表原油的精确密度, hOil代表实验容器中油膜的厚度, r代表容器半径, 本次实验各实验组内油膜厚度如表 2所示。

表 2 各实验组别油膜厚度 Tab. 2 Oil-film thicknesses in different experimental groups
序号 油膜面积/cm2 原油质量/g 油膜绝对厚度/μm
1 0.000 0.000 0.000
2 19.635 0.615 371.8
3 19.635 0.856 517.5
4 19.635 1.129 682.6
5 19.635 1.426 862.2
6 19.635 1.608 972.2
7 19.635 1.950 1 179.0
8 19.635 2.282 1 379.7
9 19.635 2.460 1 487.3
10 19.635 2.752 1 663.9
11 19.635 3.106 1 877.9
12 19.635 3.239 1 958.3

本次实验光谱采集时间为上午11: 00至中午13: 00之间, 实验当天的太阳光照情况良好, 微风, 具备较好的光谱测量条件。我们充分考虑水体低遥感反射率的特点, 采用近似朗伯体的灰板作为测量实验的标准板。视场角是指光学仪器能够观测到的最大范围的夹角, 测量时, 观测人员面向太阳, 光谱仪视场角默认为25°, 垂直观测目标物。我们在每轮测量前首先对灰板进行测量, 获取灰板的辐射亮度; 进而对各实验组别内油膜进行高光谱信息采集, 获取不同厚度油膜的辐射亮度; 观测人员背对太阳, 与阳光入射平面呈135°, 测量天空光辐亮度。每轮每个实验组采集高光谱曲线20条, 共获取不同厚度油膜光谱曲线480条(包含纯净海水光谱曲线40条), 现场实验图如图 2所示。

图 2 现场实验图 Fig. 2 Field experiment images
1.2 高光谱数据处理

本次实验获取的高光谱数据为原油油膜的辐射亮度, 需要进行辐射亮度到遥感反射率的转换, 消除天空光的影响。在忽略太阳耀斑和白帽效应等外界影响前提下, 油膜的辐射亮度计算公式如下所示:

$ \begin{aligned} L_{\mathrm{w}}\left(\lambda, \theta, \varphi ; \theta_{0}, \varphi_{0}\right)=& L_{\mathrm{sfc}}\left(\lambda, \theta, \varphi ; \theta_{0}, \varphi_{0}\right) \\ &-\rho \cdot L_{\mathrm{sky}}\left(\lambda, \theta, \varphi ; \theta_{0}, \varphi_{0}\right), \end{aligned} $ (3)

其中, Lw(λ, θ, φ; θ0,φ0)代表原油油膜的辐射亮度, Lsfc(λ, θ, φ; θ0,φ0)代表光谱仪测量的辐射亮度, ρ代表油-气界面反射率, Lsky(λ, θ, φ; θ0, φ0)代表天空辐亮度。

遥感反射率是指地物表面反射能量与到达地物表面的入射能量的比值, 遥感反射率的计算公式如下所示:

$ R_{\mathrm{rs}}(\lambda, \theta, \varphi)=\frac{L_{\mathrm{w}}\left(\lambda, \theta, \varphi ; \theta_{0}, \varphi_{0}\right) \cdot \rho_{\mathrm{p}}(\lambda)}{{\rm{ \mathsf{ π} }} \cdot L_{\mathrm{p}}(\lambda)}。$ (4)

式中, Rrs(λ, θ, φ)代表遥感反射率, ρp(λ)代表标准板反射率; Lp(λ)是标准板辐亮度, 由地物光谱仪对准标准板10~15 cm, 垂直接测量得到。

ASD地物光谱仪对油膜的测量受外界环境的影响较大, 需对受环境因素干扰严重的异常光谱曲线进行剔除。本文对实测高光谱数据进行批量遥感反射率计算, 水体对照组与不同厚度油膜实验组的遥感反射率如图 3所示。

图 3 不同厚度油膜遥感反射率 Fig. 3 Remote sensing reflectances of each experimental group

由于1 350~1 450 nm、1 800~2 050 nm与2 250~ 2 500 nm波段范围内高光谱数据受水汽强吸收影响, 出现异常波动现象, 我们剔除了这部分数据。如图 3所示, 水体的遥感反射率受细沙底质背景影响, 在可见光、近红外波段反射率较高, 在红外波段反射率较低。其中, 第2—4组内的油膜厚度较薄, 在可见光范围内, 光谱曲线受底质背景影响较为明显; 第5—12组内油膜厚度较厚, 对可见光的吸收能力较强, 故光谱曲线不易受底质影响。此外, 不同厚度油膜的高光谱数据在可见光波段可分性较差, 在近红外与短波红外范围内具有较好的光谱可分性。在近红外、短波红外范围内, 除第4实验组外, 其余各个实验组内油膜的整体遥感反射率随油膜厚度的增加而增大。

2 模型与方法

本文提出的OG-DBN模型包含原油油膜光谱特征数据自扩展模块与油膜绝对厚度反演模块两部分组成, 模型结构图如图 4所示。光谱特征数据自扩展模块由光谱特征筛选器、对抗生成网络与巴特沃斯低通滤波器三部分组成, 用于筛选可分性较好的光谱特征区间, 进而基于GAN生成高质量仿真光谱特征数据, 扩充训练样本; 绝对厚度反演模块是基于DBN, 通过正向无监督式学习与反向监督式微调相结合的方式, 提取不同厚度油膜对应的光谱特征数据的特征信息, 构建油膜绝对厚度与光谱特征信息的映射关系, 从而实现反演原油油膜的绝对厚度的功能。

图 4 OG-DBN模型结构图 Fig. 4 Structure of OG-DBN model
2.1 油膜光谱特征数据自扩展模块

本次实验所获取的高光谱数据的光谱信息量较大, 存在较大冗余性, 且部分波段范围内不同厚度光谱数据的可分性较差, 不利于精确定量反演原油油膜厚度; 因此本文为OG-DBN模型设计了光谱特征筛选器用于筛选光谱特征区间。首先对获取的各个实验组的高光谱数据进行取平均处理, 进而基于光谱特征筛选器对不同厚度油膜的可分性区间进行筛选。该光谱特征筛选器是基于光谱标准差阈值的油膜特征光谱分析提取方法构建的[16], 原理公式如下所示:

$ \left| {\overline {{\sigma _{\lambda , i, j}}} } \right| > \left\{ {{S_{\rm{D}}}\left( {{\sigma _{\lambda , i}}} \right) + {S_{\rm{D}}}\left( {{\sigma _{\lambda , i}}} \right)} \right\}, $ (5)

其中, λ代表波段, SD(σλ, i)代表i组油膜遥感反射率的标准差, SD(σλ, j)代表j组油膜遥感反射率的标准差, $\left| {\overline {{\sigma _{\lambda , i, j}}} } \right|$代表λ波段处第i组与第j组油膜遥感反射率的差值, 若$\left| {\overline {{\sigma _{\lambda , i, j}}} } \right|$大于i组油膜和j组油膜光谱标准差之和, 则该波段可被视作具有较好光谱可分性的波段。

GAN包含生成网络G与判别网络D, 其中G的目的是学习真实样本的分布, 生成相似度逼近真实样本的生成样本, 而D的目的是判断样本的真实性, 二者通过对抗训练使D判别训练样本来源的概率最大化, 同时使G生成数据与真实数据的相似度最大化, 对抗训练过程如下所示:

$ \begin{aligned} \min\limits_{G} \max\limits_{D} V(D, G)=& E_{X \sim P \operatorname{data}(x)}[\lg D(x)]+\\ & E_{X \sim P(z)}[\lg (1-D(G(z)))]. \end{aligned} $ (6)

在训练优化D时, 当D的输入为真实样本x时, 自扩展模块希望D(x)趋向于1; 当D的输入样本为生成样本G(z)时, 模块希望D(G(z))趋向于0, 即希望1-D(G(z))趋向于1, 故极大化D。在训练优化G时, 当输入信息为随机噪声z, 模块希望D(G(z))趋向于1, 即1-D(G(z))趋向于0, 故极小化模型GP代表数据分布, 当且仅当Pz=Pdata时, 极大化极小的双方博弈问题存在全局最优解, 即达到纳什平衡点。

由于基于光谱特征数据自扩展模块生成的光谱特征数据抖动性较大, 本文在该模块中设置巴特沃斯低通滤波器对生成的训练样本进行平滑去噪处理, 以最大程度的模拟真实光谱特征数据。巴特沃斯滤波器又称作最大平坦滤波器, 在通频带内幅频最平坦, 没有起伏, 而在阻频带则随频率升高而逐渐下降为零, 巴特沃斯滤波器的作用原理如下所示:

$ |H(w)|^{2}=\frac{1}{1+\left(\frac{w}{w_{\mathrm{c}}}\right)^{2 n}}, $ (7)

其中, n代表滤波器的阶数, w代表信号频率, wc代表归一化截止频率。

2.2 原油油膜绝对厚度反演模块

原油油膜绝对厚度反演模块是基于真实光谱特征数据与自扩展模块生成的仿真数据, 构建光谱特征数据与油膜绝对厚度的映射关系。我们通过迭代训练与超参数调优, 实现该模块反演原油油膜绝对厚度的功能, 该模块由4个全连接层即3个受限制向量机(restricted boltzmann machine, RBM)组成。

RBM是一类特殊的生成式神经网络如式, 单个RBM是由一层可见层与一层隐含层构成的双层神经网络, 各层内神经元无连接, 层内不存在自反馈现象, 可见层神经元与隐含层神经元之间保持双向全连接。在DBN进行逐层特征提取时, RBM层可被视为自编码器, 其可见层与隐含层之间能量函数如式8所示。

$ E(v, h, w, a, b)=-\sum\limits_{i} \sum\limits_{j} w_{i, j} v_{i} h_{j}-\sum\limits_{i} a_{i} v_{i}-\sum\limits_{j} b_{j} h_{j}, $ (8)

其中, E(v, h, w, a, b)代表RBM层能量, 其中wi, j是连接可见层中第i个神经元和隐含层中第j个神经元的权值, ab分别是可视层神经元v和隐含层神经元h的偏置量, 神经元之间的联合概率分布P(v, h, w, a, b)定义如式9所示:

$ P(v, h, w, a, b)=\frac{1}{A} e^{-E(v, h, w, a, b)}, $ (9)

式9中A的表达式如式10所示:

$ A=\sum\limits_{v} \sum\limits_{h} e^{-E(v, h, w, a, b)}. $ (10)

我们假设DBN的可见层的输入信息为X, 隐含层输出值为H, 则连接隐含层神经元与输出层神经元权重与偏置量更新公式如式11所示:

$ w_{i, j}=w_{i, j}+\varepsilon H_{j}\left(1-H_{j}\right) X(i) \sum\limits_{k} w_{j, k} e_{k}, $ (11)

式中, ek代表油膜厚度反演模块实际输出值与输入值间的差值, ε代表DBN的学习率。

本文选择线性整流函数(rectified linear unit, ReLU)作为油膜绝对厚度反演模块的激活函数。该函数能够使厚度反演模块在保持较快计算速度的前提下更加有效率的进行梯度下降, 能够很好的避免梯度消失与梯度爆炸的现象。ReLU函数的计算公式如式12所示:

$ g(x)=\max (0, x). $ (12)

原油油膜绝对厚度反演模块的反向微调过程采用了BP(back propagation, BP)算法, 该模块结合实测油膜厚度数据, 对模块整体的权重与偏执量进行逐层调整, 从而使该模块对于不同油膜的厚度的映射达到最佳效果。

3 结果与分析 3.1 精度评价指标

损失函数是用于度量真实值与预测值之间差异的评价指标, 训练神经网络就是优化损失函数并更新模型参数的过程。本文选择平均相对误差(mean relative error, MRE)作为OG-DBN模型的损失函数; 为更加直观的展现模型的反演结果与变化趋势, 我们选择平均相对精度(mean relative accuracy, MRA)作为OG-DBN模型厚度反演精度的评价指标; 本文选择决定系数(R2)来评价OG-DBN模型的拟合优度, 计算过程如下式所示:

$ M_{\mathrm{AE}}=\frac{1}{N} \sum\limits_{i=1}^{N}\left|\frac{h\left(x_{i}\right)-\hat{h}}{\hat{h}}\right| \times 100 \%, $ (13)
$ M_{\mathrm{RA}}=\left(1-\frac{1}{N} \sum\limits_{i=1}^{N}\left|\frac{h\left(x_{i}\right)-\hat{h}}{\hat{h}}\right|\right) \times 100 \%, $ (14)
$ R^{2}=1-\frac{\sum\limits_{i=1}^{N}\left(h\left(x_{i}\right)-\hat{h}\right)^{2}}{\sum\limits_{i=1}^{N}\left(h\left(x_{i}\right)-\bar{h}\right)^{2}}, $ (15)

其中, N代表测试样本个数, h(xi)代表反演值, h代表平均值, $\hat{h}$代表真实值。

我们选择平均差(mean deviation, MD)作为OG- DBN模型油膜厚度反演结果稳定性的评价指标, MD值越大表明模型的抖动性越大, 模型稳定性越差, 计算公式如式16所示。

$ {M_D} = \frac{1}{M}\sum\limits_{i = 1}^M {\left| {g\left( {{x_i}} \right) - \overline g } \right|} , $ (16)

其中, M代表反演实验次数, g(xi)代表模型单次反演结果, g代表模型多次反演结果的平均值。

3.2 光谱特征筛选

本次实验使用ASD-FieldSpec4地物光谱仪开展室外油膜光谱测量实验。实验所获取的高光谱数据共计2 150个波段, 存在较大的光谱冗余信息, 从而导致硬件计算负担过重; 此外, 部分光谱区间内不同厚度油膜间的光谱曲线可分性不足, 不利于油膜厚度的精确反演。因此本文为OG-DBN模型搭载了光谱特征筛选器, 用于筛选对不同厚度油膜响应较好的光谱特征区间。打开OG-DBN模型的光谱特征筛选器开关, 对11个油膜实验组的光谱曲线两两进行光谱特征区间筛选, 对筛选出的光谱特征区间进行取交集操作, 筛选结果如表 3所示。

表 3 光谱特征筛选器筛选光谱特征区间结果 Tab. 3 Spectral feature filtering experimental results
序号 光谱特征区间/nm
1 350~359
2 1 300~1 349
3 1 450~1 694
4 1 775~1 799
5 2 050~2 246

350~359 nm范围内的光谱数据与不同实验组的油膜厚度数据对应较为混乱, 并且可分性不是很强。除此之外, 350~359 nm属于紫外范围, 紫外范围的光谱数据对于薄油膜较为敏感, 对于厚油膜敏感性较差。1 775~1 799 nm范围内厚油膜间的光谱可分性较差。因此, 根据光谱特征筛选器的筛选结果, 剔除该光谱特征区间, 最终选择1 300~1 349 nm、1 450~ 1 694 nm与2 050~2 246 nm波段范围内高光谱数据作为本次油膜厚度反演实验的光谱特征数据, 如图 7灰色光谱范围所示。

图 5 光谱特征区间 Fig. 5 Spectral feature intervals

图 6 样本自扩展实验结果 Fig. 6 Sample data of self-expanding experiment inversion results

图 7 真实光谱特征数据 Fig. 7 Real spectral feature data curves

本次实验共获取不同厚度油膜高光谱曲线440条(11个油膜实验组), 将光谱特征筛选器筛选出的光谱特征数据分为训练样本与测试样本, 比例设置为2︰1, 用于OG-DBN模型的训练与模型反演精度的检测, 并对比全波段高光谱数据的反演结果, 探究光谱特征筛选器的必要性, 实验结果如表 4所示。

表 4 光谱特征筛选器实验精度 Tab. 4 Spectral feature filter experiment inversion accuracy
实验数据 原油油膜绝对厚度反演精度/% 时间/s
$\overline {{M_{\rm RA}}} $ (单次实验) $\overline {{M_{\rm RA}}} $+MD R2
全波段高光谱数据 89.75/89.78/89.66/89.66/89.61 89.69±0.06 0.918 150.6
光谱特征数据 94.93/94.96/94.99/94.99/94.98 94.97±0.02 0.961 45.1

表 4显示, 基于光谱特征数据的油膜厚度反演精度可以达到94.97%, 模型的决定系数R2达到0.961, 实验结果的平均差控制在±0.02%, 相对于基于全波段高光谱数据的油膜厚度反演结果, 反演精度提高了5.28%, 模型拟合优度提高了0.043, 并且表现出较好的模型稳定性; 此外, 基于光谱特征数据的油膜厚度反演实验耗时仅为45.1 s, 远远低于基于全波段高光谱数据油膜厚度反演实验所需的150.6 s, 大大减少了实验时间与硬件负担。实验结果表明, OG-DBN模型搭载光谱特征筛选器可以有效地剔除高光谱数据中的冗余信息, 筛选光谱可分性较高的光谱特征数据, 提高模型的反演精度与拟合优度, 减少模型的计算量, 加快模型的收敛速度。

3.3 样本自扩展

在现阶段研究中, 原油油膜绝对厚度实验数据大多在室内可控条件下获取, 并且获取的数据量有限, 而油膜绝对厚度的反演需要大量数据的支持。本文提出的OG-DBN模型可以基于GAN的对抗训练过程, 生成高质量仿真原油油膜光谱特征数据。模型通过样本的自扩展过程, 可以丰富样本的多样性, 提高模型的泛化能力, 从而提高模型的反演精度。本文在充分考虑模型在预实验中的反演精度、模型的稳定性与拟合优度后, 我们将自扩展样本数量设置为0~1 000, 探究具有最佳反演效果的自扩展样本数量, 样本自扩展实验结果如表 5所示。

表 5 样本自扩展实验精度 Tab. 5 Sample data of self-expanding experiment inversion accuracy
自扩展样本数量 原油油膜绝对厚度反演精度/% 时间/s
MRA(单次实验) $\overline {{M_{\rm RA}}} $+MD R2
0 94.93/94.96/94.99/94.99/94.98 94.97±0.02 0.961 45.1
100 96.06/96.05/96.09/96.15/96.10 96.08±0.03 0.969 51.2
200 96.10/96.16/96.18/96.17/96.19 96.16±0.02 0.965 55.6
300 96.22/96.24/96.23/96.33/96.24 96.25±0.03 0.970 63.1
400 96.26/96.32/96.34/96.31/96.21 96.29±0.04 0.969 74.8
500 96.51/96.54/96.51/96.52/96.40 96.50±0.03 0.970 81.3
600 96.76/96.74/96.68/96.71/96.65 96.71±0.03 0.971 86.9
700 96.61/96.59/96.70/96.58/96.65 96.63±0.04 0.966 88.3
800 96.49/96.58/96.65/96.58/96.56 96.57±0.04 0.969 94.4
900 96.54/96.63/96.50/96.43/96.50 96.52±0.05 0.970 99.2
1 000 96.55/96.58/96.60/96.58/96.42 96.55±0.05 0.968 102.8

表 5显示, 随着自扩展样本数量的增加, 计算机计算负担加重, 反演实验的时间也随之增加。如图 6a所示, 在一定范围内, 模型的反演精度随着自扩展样本数量的增加整体呈现上升趋势, 当样本数量为600时, 油厚反演精度达到峰值96.71%, 相比于样本自扩展前, 反演精度提高了1.74%, 后呈现下降趋势; 如图 6b所示, 在OG-DBN模型反演精度到达峰值的同时, 模型的R2达到峰值0.971, 表现出优秀的模型拟合优度; 此外, 如图 6c所示, OG-DBN模型的整体稳定性随样本数量的增加降低, 在样本数量达到1 000时, 反演结果的平均差达到±0.05%, 模型表现出明显的抖动。

由此可以发现, 在一定范围内, 随着自扩展样本数量的增加, 样本的多样性增强, 在一定程度上可以丰富模型的泛化性, 提高反演精度, 优化模型的拟合度; 但样本数量不是越多越好, 在自扩展样本数量超过600之后, OG-DBN模型处于过拟合状态, 反演精度随之降低。此外, OG-DBN模型虽然可以基于实测光谱数据进行样本自扩展, 但该过程所生成的光谱特征数据并不等同于真实的光谱特征数据, 虽然在一定范围内可以提高模型的反演精度, 但随着生成的仿真数据数量的增加, 模型的稳定性会随之降低。

3.4 巴特沃斯滤波

GAN作为一类生成式神经网络, 通过对抗训练过程模拟真实样本数据时具有一定的波动性, 因此OG-DBN模型基于样本自扩展模块生成的仿真光谱特征数据会存在抖动现象。我们在GAN后装置了巴特沃斯低通滤波器对生成的数据进行滤波, 以保证生成的仿真数据能够最大程度地接近真实光谱特征数据, 从而提高油膜厚度的反演精度。如图 8所示, 经过样本自扩展与滤波处理(归一化截止频率暂设为0.1)后, 生成的光谱特征数据已经能够很好地还原真实光谱特征数据的光谱趋势以及不同厚度油膜间的光谱差异性。

图 8 生成的光谱特征数据 Fig. 8 Generated spectral feature data curves

为保证滤波器的滤波效果, 我们统一将滤波器的阶数设置为10阶, 通过调整归一化截止频率, 对比不同归一化截止频率下的油膜厚度反演实验结果, 探究装备巴特沃斯滤波器的必要性, 实验结果如表 6所示。

表 6 归一化截止频率调整实验精度 Tab. 6 Inversion accuracy for various values of normalized cut-off frequency
归一化截止频率 原油油膜绝对厚度反演精度/% 时间/s
MRA(单次实验) $\overline {{M_{\rm RA}}} $+MD R2
0 96.76/96.74/96.68/96.71/96.65 96.71±0.03 0.971 86.9
0.1 97.01/97.14/97.07/97.17/97.06 97.09±0.05 0.976 90.2
0.2 97.58/97.68/97.36/97.45/97.60 97.53±0.10 0.979 91.3
0.3 97.74/97.55/97.74/97.68/97.72 97.69±0.06 0.980 92.8
0.4 97.65/97.58/97.56/97.57/97.65 97.60±0.04 0.981 93.7
0.5 97.66/97.69/97.63/97.67/97.32 97.61±0.08 0.979 94.5
0.6 97.51/97.55/97.30/97.47/97.56 97.48±0.07 0.980 95.1
0.7 97.36/97.40/97.41/97.53/97.71 97.48±0.11 0.979 96.6
0.8 97.45/97.22/97.30/97.45/97.20 97.32±0.10 0.978 96.9
0.9 97.36/97.27/97.36/97.40/97.45 97.37±0.05 0.979 97.3

表 6显示, 当我们将巴特沃斯低通滤波器的归一化截止频率设置为0.3时, OG-DBN模型的反演精度达到峰值97.69%, 同时R2保持在0.980, 展现出优秀的反演效果与模型拟合精度; 当归一化截止频率为0.7时, 模型反演结果的平均差达到±0.11%, 模型抖动剧烈。由图 9a图 9b可以看出, 在OG-DBN模型装备了巴特沃斯滤波器后, 油膜厚度的反演精度与模型拟合优度有了明显的提升; 此外, 如图 9c所示, 当归一化截止频率设置为0.3时, 模型反演结果的平均差相对于未装置滤波器的实验组略有上升, 但仍处于可控范围之内, 很好的抑制了模型在实验过程中可能会出现的抖动现象。

图 9 归一化截止频率调整结果 Fig. 9 Inversion results for various values of normalized cut-off frequency

上述表明, 我们在样本自扩展模块中装备巴特沃斯低通滤波器, 可以在保证OG-DBN模型稳定性的同时大幅提高模型反演油膜厚度的精度与模型拟合优度; 当归一化截止频率设置为0.3时, 滤波器可以有效地对样本自扩展模块生成的仿真光谱特征数据进行滤波平滑, 以生成最贴近于真实光谱特征数据的训练样本, 从而提高OG-DBN模型的反演精度与拟合效果。

3.5 模型鲁棒性测试

由于本次实验环境较为理想, 为验证OG-DBN模型在复杂情况下的反演能力, 我们在光谱特征数据中随机加入5%、10%、15%、20%、25%与30%的随机高斯噪声, 模拟外部环境干扰, 从而对模型的鲁棒性进行分析, 实验结果如表 7所示。

表 7 模型鲁棒性测试实验精度 Tab. 7 Model robustness test experiment inversion accuracy
Gauss噪声比例/% 原油油膜绝对厚度反演精度/% 时间/s
MRA(单次实验) $\overline {{M_{\rm RA}}} $+MD R2
0 97.74/97.55/97.74/97.68/97.72 97.69±0.06 0.971 92.8
5 97.48/96.99/97.03/96.81/96.80 97.02±0.19 0.971 93.7
10 96.69/96.89/96.31/96.89/96.76 96.71±0.17 0.968 94.1
15 96.67/96.73/96.51/96.21/96.63 96.58±0.18 0.970 94.5
20 95.00/96.20/95.96/94.69/95.47 95.46±0.50 0.968 94.8
25 94.62/94.65/95.32/94.40/92.97 94.39±0.57 0.958 95.2
30 94.30/92.87/93.63/92.43/93.46 93.33±0.55 0.957 95.9

图 10a图 10b显示, 随着高斯噪声比例的增加, OG-DBN模型的反演精度与拟合优度整体呈现下降趋势, 当高斯噪声的比例达到30%时, 模型的反演精度下降到93.33%, R2降低到0.957; 此外, 如图 10c所示, 随着噪声比例的增加, 模型的抖动性整体呈现上升趋势, 模型不稳定程度增加, 当高斯噪声的比例达到25%时, 模型的抖动最为剧烈, 反演结果的平均差达到±0.57%, 但模型仍正常收敛, 保持94.39%的反演精度。

图 10 模型鲁棒性测试实验结果 Fig. 10 Model robustness test experiment inversion results

综上, 当OG-DBN模型受到外部因素干扰时, 原油油膜绝对厚度的反演精度与模型拟合优度会受到一定的影响, 模型的稳定性会减弱。实验结果表明, 该模型能够很好地抑制干扰因素的影响, 保证模型的正常收敛过程, 稳定地将反演精度保持在93.33%以上, R2保持在0.957以上, 平均差控制在±0.55以内。在本次测试实验中, OG-DBN模型的反演结果与整体稳定性令人满意, 表现出较为优秀的鲁棒性。

4 结论与讨论

伴随着海洋溢油事故发生频率的逐年提升, 将深度学习与遥感技术结合, 精确反演海面油膜厚度来获取海面溢油量具有重要意义。通过开展室外场景实验, 模拟真实海洋环境, 以保证获取最接近于真实场景的原油油膜高光谱数据。不是所有的光谱数据都有利于油膜绝对厚度的精确反演, 部分可分性较差的数据会干扰模型的反演过程, 降低模型的反演精度, 本文提出的OG-DBN模型能够基于光谱特征筛选器自动筛选光谱响应较好的光谱特征区间。主要分布在3个光谱特征区间, 共包含517个波段, 能够体现高光谱遥感的优势, 在提高模型反演精度的同时, 可降低计算成本; 模型可以基于实测光谱数据进行样本自扩展, 扩充样本数量, 提高模型泛化性与反演精度, 有效地解决现阶段现场实测数据不足的问题; 与传统遥感建模反演方法不同, 本文模型可以基于DBN, 充分挖掘光谱特征数据的光谱特性, 避免以往实验过程中出现的光谱信息损失, 保证模型的反演精度。实验结果表明, 本文提出的OG-DBN模型无论在厚度反演结果还是模型稳定性方面都具有优秀的表现。因此, 未来将该方法应用到海洋溢油灾害中的海面油膜厚度反演研究, 具有技术可行性。

本次实验时间为冬季, 实验场景缺少真实海面风浪, 原油油膜不易扩散, 故我们采取对实验水体加热并搅拌油膜的做法, 以此来加快油膜的扩散过程, 待水体冷却至常温时再进行观测实验。在加热水体后, 原油吸收热量温度上升, 导致油膜的近红外与短波红外范围内的遥感反射率增大, 即使水体冷却至常温, 油膜的光谱曲线也会略有不同。众所周知, 海面溢油在阳光长时间照射下温度会升高, 部分油田爆炸起火后也会使周边海域溢油温度增加, 从而影响油膜的光谱曲线。因此, 本文研究团队将于气温适宜时, 开展油膜自然扩散对照实验, 探究水域温度对于原油油膜光谱曲线以及油膜厚度反演实验结果的影响。

参考文献
[1]
Leifer I, William J L, Debra S, et al. State of the art satellite and airborne marine oil spill remote sensing: Application to the BP Deepwater Horizon oil spill[J]. Remote Sensing of Environment, 2012, 124: 185-209. DOI:10.1016/j.rse.2012.03.024
[2]
Fingas M, Brown C. Review of oil spill remote sensing[J]. Marine Pollution Bulletin, 2014, 83(1): 9-23. DOI:10.1016/j.marpolbul.2014.03.059
[3]
Keramitsoglou I, Cartalis C, Kiranoudis C T, et al. Automatic identification of oil spills on satellite images[J]. Environmental Modelling & Software, 2016, 21(5): 640-652.
[4]
Garcia-Pineda O, Macdonald I, Hu C M, et al. Detection of floating oil anomalies from the deep water horizon oil spill with synthetic aperture radar[J]. Oceanography, 2013, 26(2): 124-137.
[5]
方四安, 黄小仙, 尹达一, 等. 海洋溢油模拟目标的紫外反射特性研究[J]. 光谱学与光谱分析, 2010, 30(3): 738-742.
Fang Si'an, Huang Xiaoxian, Yin Dayi, et al. Research on the ultraviolet reflectivity characteristic of simulative targets of oil spill on the ocean[J]. Spectroscopy and Spectral Analysis, 2010, 30(3): 738-742. DOI:10.3964/j.issn.1000-0593(2010)03-0738-05
[6]
Hu J C, Wang D F. Monitoring method of ocean oil spilling based on remote sensing[J]. Environmental Protection Science, 2014, 40(1): 68-73.
[7]
任广波, 过杰, 马毅, 等. 海面溢油无人机高光谱遥感检测与厚度估算方法[J]. 海洋学报, 2019, 41(5): 146-158.
Ren Guangbo, Guo Jie, Ma Yi, et al. Oil spill detection and slick thickness measurement via UAV hyperspectral imaging[J]. Haiyang Xuebao, 2019, 41(5): 146-158.
[8]
Lu Y C, Zhan W F, Hu C M, et al. Detecting and quantifying oil slick thickness by thermal remote sensing: A ground-based experiment[J]. Remote Sensing of Environment, 2016, 181: 207-217. DOI:10.1016/j.rse.2016.04.007
[9]
Lu Y C, Tian Q J, Li X, et al. The remote sensing inversion theory of offshore oil slick thickness, based on a two-beam interference model[J]. Science China Earth Sciences, 2011, 54(5): 678-685. DOI:10.1007/s11430-010-4154-1
[10]
姜宗辰, 马毅, 江涛, 等. 基于深度置信网络(DBN)的赤潮高光谱遥感提取研究[J]. 海洋技术学报, 2019, 38(2): 1-7.
Jiang Zongchen, Ma Yi, Jiang Tao, et al. Research on the Extraction of Red Tide Hyperspectral Remote Sensing Based on the Deep Belief Network. Journal of Ocean Technology[J]. Ocean Technology, 2019, 38(2): 17.
[11]
Chen Y S, Jiang H L, Li C Y, et al. Deep feature extraction and classification of hyperspectral images based on convolutional neural networks[J]. IEEE Geoscience and Remote Sensing, 2016, 54(10): 6232-6251. DOI:10.1109/TGRS.2016.2584107
[12]
Hu F, Xia G S, Hu J W, et al. Transferring deep convolutional neural networks for the scene classification of high-resolution remote sensing imagery[J]. Remote Sensing, 2015, 7(11): 14680-14707. DOI:10.3390/rs71114680
[13]
Zhang H, Xu T, Li H S, et al. StackGAN++: Realistic image synthesis with stacked generative adversarial networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, 41(8): 1947-1962. DOI:10.1109/TPAMI.2018.2856256
[14]
Mao X D, Li Q, Xie H R, et al. Least squares generative adversarial networks[J]. ieee international Conference on Computer Vision, 2016, 2813-2821.
[15]
Jiang Z C, Ma Y. Accurate extraction of offshore raft aquaculture areas based on a 3D-CNN model[J]. International Journal of Remote Sensing, 2020, 41(14): 5457-5481. DOI:10.1080/01431161.2020.1737340
[16]
Schmidt K S, Skidmore A K. Exploring spectral discrimination of grass species in African rangelands[J]. International Journal of Remote Sensing, 2001, 22: 3421-3434. DOI:10.1080/01431160152609245