
文章信息
- 赵健, 刘展, 樊彦国, 丁宁. 2018.
- ZHAO Jian, LIU Zhan, FAN Yan-guo, DING Ning. 2018.
- BP神经网络精度估计及其在海洋油气资源预测中的应用
- Precision estimation of BP neural network and its application in ocean oil and gas resources prediction
- 海洋科学, 42(11): 59-63
- Marine Sciences, 42(11): 59-63.
- http://dx.doi.org/10.11759/hykx20180427001
-
文章历史
- 收稿日期:2018-04-27
- 修回日期:2018-05-30
2. 青岛海洋科学与技术国家实验室海洋矿产资源评价与探测技术功能实验室, 山东 青岛 266071
2. Laboratory for Marine Mineral Resources, Qingdao National Laboratory for Marine Science and Technology, Qingdao 266071, China
人工神经网络是目前非线性方法技术的研究热点之一, 在海洋油气资源勘探领域有许多成功的应用[1-4]。神经网络算法的性能优劣取决于网络结构、神经元性质与训练方法等, 其性能评价主要是通过检验数据集衡量所建立的模型对于新输入的预测能力, 即泛化能力。神经网络模型具有自适应性好、容错能力强、预测速度快的特点, 但是预测前需要进行属性优选; 而且在学习训练阶段, 需要有足够多的代表性强的样本数据, 才能达到较好的学习效果[4-5]。属性优选是基础, 网络训练是关键。
在应用神经网络算法解决实际问题时, 用户通常根据设定的最小误差和最大训练次数来判断学习训练过程是否有效, 进而通过增大训练次数、调整网络结构或参数使学习过程满足精度要求[2-3]。另外, 对于学习训练满足精度要求的神经网络模型, 如何对其泛化能力进行评价, 即如何评价神经网络算法的精度, 在此前的研究中并未涉及。在网络结构、参数不尽相同的情况下, 如何评价同一组样本学习训练过程的精度高低, 是阻碍神经网络应用的一个问题。本文以BP神经网络为例, 尝试基于测量数据处理中的误差理论对神经网络算法的精度进行估计, 并结合海洋油气资源预测资料进行具体研究。
1 BP神经网络精度分析反向传播网络(back-propagation network, 简称BP网络)是神经网络研究中最常用的一种, 是指基于误差反向传播算法(BP算法)的多层前向神经网络[5-6]。设隐含层为一层, 则一个三层的BP网络中, 各层均有不同的节点(神经元)数目, 且每个节点都带有一个输入为1的偏差值(阈值)
根据测量数据处理中的误差理论知识, 测量数据成果的精度评定包括两个方面: 一是观测值的实际精度; 二是由观测值经平差得到的观测值函数的精度[7-8]。对于BP神经网络而言, 第一方面对应的是模型学习训练阶段学习样本的实际精度; 第二方面对应的则是模型预测阶段预测结果的实际精度。
1.1 学习训练过程的精度评定BP神经网络的学习训练过程是根据学习样本实际输出与目标输出之间的差值不断调整权值, 由于目标输出已知, 将其视为观测值L, 将实际输出视为平差值
$\hat{\boldsymbol{\delta}}_{0}^{2}=\frac{\boldsymbol{V}^{\mathrm{T}} \boldsymbol{P} \boldsymbol{V}}{r}$ . | (1) |
学习样本集中各输入向量值为单独获得, 视为独立观测值, 则式(1)中, 观测值权阵P为单位阵I。若用条件平差方法求解[7], 法方程系数为:
$\boldsymbol{N}_{\mathrm{aa}}=\boldsymbol{A} \boldsymbol{P}^{-1} \boldsymbol{A}^{\mathrm{T}}$ , | (2) |
式中, A为m×n阶矩阵, A中所有元素均为1。则实际输出值
${\mathit{\boldsymbol{Q}}_{\mathit{\boldsymbol{\widehat L}}\mathit{\boldsymbol{\widehat L}}}}\mathit{\boldsymbol{ = }}{\mathit{\boldsymbol{Q}}_{\mathit{\boldsymbol{LL}}}}\mathit{\boldsymbol{ - }}{\mathit{\boldsymbol{Q}}_{\mathit{\boldsymbol{VV}}}}\mathit{\boldsymbol{ = Q - Q}}{\mathit{\boldsymbol{A}}^{\rm{T}}}\mathit{\boldsymbol{N}}_{{\rm{aa}}}^{{\rm{ - 1}}}\mathit{\boldsymbol{AQ}}$ , | (3) |
式中, Q为P的协因数阵, Q=P–1。则模型学习训练阶段样本实际输出值的中误差为:
${\mathit{\boldsymbol{\hat \delta }}_{\mathit{\boldsymbol{\hat L}}}} = {\mathit{\boldsymbol{\hat \delta }}_0}\sqrt {{\mathit{\boldsymbol{Q}}_{\mathit{\boldsymbol{\hat L\hat L}}}}} $ . | (4) |
BP神经网络在学习训练过程完成之后, 网络各层之间的联系以各层节点间连接权的形式固定下来, BP神经网络即可根据预测过程的输入向量, 利用已确定的权值及偏差向量, 计算得到对应的预测结果。计算过程如下:
设由
由误差理论中的非线性函数协因数传播律[10],
$\hat{\boldsymbol{\delta}}_{\hat{y}}=\hat{\boldsymbol{\delta}}_{0} \sqrt{\boldsymbol{Q}_{\hat{y} \hat{y}}}$ , | (5) |
式(5)中,
首先对渤海湾某研究区圈定的油气化探异常, 结合研究区内的油气地质、地球物理等勘探资料, 建立异常的BP神经网络综合评价预测模型, 模型学习训练及预测阶段的具体过程详见参考文献[2]。特别注意的是, 在构建BP神经网络预测模型时, 应对研究区内已知的各类化探异常样本进行充分的属性提取, 选取足够多的、具有代表性的异常样本组成学习样本集, 进行BP神经网络预测模型的学习训练; 再利用训练后的预测模型对研究区内未知化探异常进行油气资源预测, 以达到更好的预测效果。
预测模型采用3层BP网络结构, 输入层节点数设为7, 分别对应研究区内各化探异常的7类评价指标的具体得分。根据渤海湾某研究区勘探资料, 通过对已知钻井的分析研究, 共选取7种指标组成BP网络输入属性。首先进行油气地质综合分析, 主要考虑油气生成、运移、成藏等因素及先后顺序关系, 得到油气地质综合评价(F5)指标; 同时结合同步荧光330 nm (F1)、酸解烃丙烷(F2)、酸解烃乙烯(F3)、热释烃乙烷(F4)等油气化探指标, 以及重力垂向二阶导数(F6)、磁力垂向一阶导数(F7)等组成BP网络输入, 以7种指标在各化探异常的得分值作为样本输入。隐含层设为单隐层, 节点数为10个。输出层节点数设为6, 对应油气资源评价的6种类别, 期望输出及评价结果具体含义如表1所示。输出层各节点均采用(0, 1)之间的连续函数输出, 网络学习训练及预测阶段均选取输出值最大者所在的节点输出为最终的评价结果类别。
编号 | 期望输出 | 评价结果 |
1 | [1, 0, 0, 0, 0, 0] | 含油气藏 |
2 | [0, 1, 0, 0, 0, 0] | 含油藏 |
3 | [0, 0, 1, 0, 0, 0] | 含少量油藏 |
4 | [0, 0, 0, 1, 0, 0] | 含气藏 |
5 | [0, 0, 0, 0, 1, 0] | 含少量气藏 |
6 | [0, 0, 0, 0, 0, 1] | 无油气 |
随机选取研究区20组已知化探异常中的10组作为学习模式组成训练样本集, 对BP网络预测模型进行学习训练, 网络最大学习次数不超过50 000次, 系统最大误差小于0.000 05。BP网络经过30 000次训练后收敛, 误差满足要求, 学习训练过程结束, 10组已知异常的实际输出与真实输出的对比如表2所示。从表2可以看出, BP网络预测模型在学习训练阶段的实际输出与期望输出非常吻合。
异常 编号 |
得分 | 真实输出 | 实际输出 | 评价结果 | ||||||
F1 | F2 | F3 | F4 | F5 | F6 | F7 | ||||
EA1 | 1 | 0 | 0.5 | 0.5 | 0.32 | 1 | 1 | [0, 0, 0, 0, 1, 0] | [0.000 802, 0.000 56, 0.000 457, 0.000 184, 0.999 514, 0.000 511] |
少量气藏 |
EA3 | 0.5 | 0.75 | 1 | 0 | 0.45 | 0 | 0.5 | [0, 0, 0, 1, 0, 0] | [0.000 015, 0.000 141, 0.000 496, 0.998 418, 0.000 496, 0.001 559] | 气藏 |
EA4 | 0.75 | 0 | 0.25 | 0.25 | 0.3 | 1 | 0.75 | [0, 0, 0, 0, 1, 0] | [0.000 793, 0.000 606, 0.000 468, 0.000 106, 0.999 478, 0.001 555] | 少量气藏 |
EA5 | 1 | 0.5 | 0 | 0 | 0.28 | 0 | 0.75 | [0, 0, 0, 0, 1, 0] | [0.001 036, 0.000 487, 0.000 46, 0.000 598, 0.997 616, 0.000 328] |
少量气藏 |
EA6 | 0.75 | 1 | 0.5 | 1 | 0.26 | 1 | 0.5 | [0, 0, 0, 0, 1, 0] | [0.000 725, 0.000 44, 0.000 439, 0.001 087, 0.998 523, 0.000 109] |
少量气藏 |
EA7 | 0.25 | 0.5 | 0.25 | 1 | 0.86 | 0.25 | 0.75 | [1, 0, 0, 0, 0, 0] | [0.998 399, 0.000 595, 0.000 507, 0.000 006, 0.000 263, 0.001 699] | 油气藏 |
EA9 | 0.5 | 1 | 0.75 | 0 | 0.42 | 0.25 | 0.5 | [0, 0, 0, 1, 0, 0] | [0.000 01, 0.000 168, 0.000 562, 0.997 6, 0.001 918, 0.001 43] |
气藏 |
WA1 | 1 | 0 | 0 | 0.75 | 0.86 | 0.25 | 1 | [1, 0, 0, 0, 0, 0] | [0.997 6, 0.000 603, 0.000 471, 0.000 002, 0.001 698, 0.001 536] |
油气藏 |
WA4 | 0.75 | 0 | 1 | 0 | 0.6 | 1 | 1 | [0, 0, 0, 0, 1, 0] | [0.000 464, 0.000 431, 0.000 447, 0.001 663, 0.998 87, 0.000 09] | 少量气藏 |
10 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | [0, 0, 0, 0, 0, 1] | [0.002 703, 0.000 91, 0.000 913, 0.002 444, 0.002 256, 0.996 538] |
无油气 |
注: EA为东区异常; WA为西区异常; 10为无油气异常 |
对于研究区内剩余10组化探异常, 利用学习训练后的BP网络预测模型对其进行含油气综合评价预测, 结果如表3所示。从表3中可以看出, 剩余10组化探异常的含油气评价预测结果分为4种: 油气区、油区、气区及少量气区。经与实际勘探资料比对, 与实际钻井结果吻合较好。
异常 编号 |
得分 | 实际输出 | 评价结果 | ||||||
F1 | F2 | F3 | F4 | F5 | F6 | F7 | |||
EA2 | 0 | 0 | 0 | 0 | 0.41 | 1 | 0 | [0.003 8, 0.000 8, 0.000 5, 0, 0.903 4, 0.015] | 少量气藏 |
EA8 | 1 | 1 | 0 | 0.75 | 0.24 | 0.5 | 0.25 | [0.001 2, 0.000 5, 0.000 5, 0.000 4, 0.998 3, 0.000 3] | 少量气藏 |
EA10 | 0 | 0 | 0 | 1 | 0.29 | 0.75 | 0.5 | [0.992 5, 0.000 8, 0.000 6, 0, 0.007 3, 0.023 5] | 油气藏 |
EA11 | 0 | 0 | 0 | 0.75 | 0.23 | 0.75 | 0.25 | [0.922 1, 0.000 9, 0.000 6, 0, 0.045 1, 0.118 1] | 油气藏 |
EA12 | 0.75 | 0 | 0 | 0.25 | 0.48 | 0.5 | 0.25 | [0.058 5, 0.000 8, 0.000 5, 0, 0.935 4, 0.015 6] | 少量气藏 |
EB1 | 0.5 | 0.5 | 0.75 | 1 | 0.26 | 0.75 | 0.25 | [0.005 9, 0.000 4, 0.000 4, 0.001 2, 0.955 5, 0.000 1] | 少量气藏 |
WA2 | 0.25 | 0 | 1 | 0.25 | 0.75 | 1 | 1 | [0.005 6, 0.000 4, 0.000 4, 0.002 1, 0.969 6, 0] | 少量气藏 |
WA3 | 0 | 1 | 0.25 | 1 | 0.92 | 1 | 1 | [0.959 1, 0.000 5, 0.000 4, 0, 0.021 5, 0.000 1] | 油气藏 |
WA5 | 0 | 0 | 0.25 | 1 | 0.36 | 0.75 | 0.75 | [0.994 9, 0.000 7, 0.000 5, 0, 0.004 7, 0.004 7] | 油气藏 |
WB1 | 0.75 | 0.5 | 0.5 | 0.75 | 0.95 | 1 | 1 | [0.130 6, 0.000 4, 0.000 4, 0.000 2, 0.907 5, 0] | 少量气藏 |
注: EB为东区异常; WB为西区异常 |
由表2中学习样本期望输出与实际输出之差可得到残差V, 利用式(1)即可求得单位权方差估值
经过计算, BP神经网络学习训练阶段样本实际输出值的中误差分别为:
可见BP神经网络学习训练过程的精度较高, 输出层6个节点的中误差中最大仅为0.001 4, 可以满足异常评价的要求, 表明BP神经网络结构设计合理, 学习样本选择合理。
2.2.2 预测过程精度评价由于BP神经网络预测过程中输入
异常 编号 |
得分 | 实际输出 | 评价结果 | ||||||
F1 | F2 | F3 | F4 | F5 | F6 | F7 | |||
EA2 | 0.001 | 0.001 | 0.001 | 0.001 | 0.411 | 1.001 | 0.001 | [0.004 1, 0.000 9, 0.000 6, 0.001, 0.905 1, 0.014 924] | 少量气藏 |
EA8 | 1.001 | 1.001 | 0.001 | 0.751 | 0.241 | 0.501 | 0.251 | [0.001 3, 0.000 6, 0.000 55, 0.000 51, 0.999 1, 0.000 42] | 少量气藏 |
EA10 | 0.001 | 0.001 | 0.001 | 1.001 | 0.291 | 0.751 | 0.501 | [0.993 2, 0.000 91, 0.000 71, 0.001, 0.008 2, 0.023 3] | 油气藏 |
EA11 | 0.001 | 0.001 | 0.001 | 0.751 | 0.231 | 0.751 | 0.251 | [0.923 3, 0.000 9, 0.000 62, 0.002, 0.046 2, 0.116 3] | 油气藏 |
EA12 | 0.751 | 0.001 | 0.001 | 0.251 | 0.481 | 0.501 | 0.251 | [0.058 1, 0.000 67, 0.000 64, 0, 0.935 9, 0.015 3] | 少量气藏 |
EB1 | 0.501 | 0.501 | 0.751 | 1.001 | 0.261 | 0.751 | 0.251 | [0.006 2, 0.000 53, 0.000 52, 0.001 8, 0.955 8, 0.000 3] | 少量气藏 |
WA2 | 0.251 | 0.001 | 1.001 | 0.251 | 0.751 | 1.001 | 1.001 | [0.006 2, 0.000 54, 0.000 54, 0.003 1, 0.970 7, 0.000 2] | 少量气藏 |
WA3 | 0.001 | 1.001 | 0.251 | 1.001 | 0.921 | 1.001 | 1.001 | [0.958 8, 0.002 5, 0.001 4, 0.002, 0.022 7, 0.000 3] | 油气藏 |
WA5 | 0.001 | 0.001 | 0.251 | 1.001 | 0.361 | 0.751 | 0.751 | [0.995 2, 0.001 7, 0.001 5, 0, 0.005 7, 0.005 2] | 油气藏 |
WB1 | 0.751 | 0.501 | 0.501 | 0.751 | 0.951 | 1.001 | 1.001 | [0.129 9, 0.001 4, 0.001 6, 0.001 2, 0.908 2, 0.002] | 少量气藏 |
注: EB为东区异常; WB为西区异常 |
经过计算, BP神经网络预测模型预测阶段实际输出值的中误差分别为:
对比BP神经网络学习训练阶段, 可以发现虽然预测阶段输出层各节点的中误差普遍稍大于学习训练阶段各输出层节点中误差, 但仍达到了较好的预测效果, 其中误差最大为0.004 3, 最小为0.001 0; 学习训练阶段输出值中误差最大为0.001 4, 最小为0.000 2。出现这种差别的原因与BP神经网络具体实施过程中网络结构的设计、参数设定及学习样本的选取等因素有关, 也与系数阵
BP神经网络具有很强的学习能力, 能从已知信息中得到有利于解决最优化问题的结论; 随着对神经网络算法研究的不断深入, 其在海洋油气资源勘探中的应用前景也将更加广阔。但在应用神经网络算法解决实际问题时, 用户一般只是根据预先设定的最小误差和最大训练次数来判断训练是否有效。本文基于测量数据处理中的误差理论分别对BP神经网络学习训练过程和预测过程的输出层节点中误差进行计算, 并结合海洋油气资源预测实测资料实现了对BP神经网络的精度评定。该方法可推广到其他神经网络模型的精度估计中, 为不同领域最优神经网络模型的结构设计及参数设置提供有效参考。
[1] |
徐海浪, 吴小平. 电阻率二维神经网络反演[J]. 地球物理学报, 2006, 49(2): 584-589. Xu Hailang, Wu Xiaoping. 2-D resistivity inversion using the neural network method[J]. Chinese J Geophys, 2006, 49(2): 584-589. DOI:10.3321/j.issn:0001-5733.2006.02.035 |
[2] |
赵健, 刘展, 张勇. 激光单分子BTEX异常的人工神经网络评价技术[J]. 海洋科学, 2008, 32(3): 6-12. Zhao Jian, Liu Zhan, Zhang Yong. Artificial neural network evaluation technology for comprehensive evaluation of BTEX anomalies using a single molecule detection by laser[J]. Marine Sciences, 2008, 32(3): 6-12. |
[3] |
郭志宏, 熊盛青, 周坚鑫, 等. 航空重力重复线测试数据质量评价方法研究[J]. 地球物理学报, 2008, 5(5): 1538-1543. Guo Zhihong, Xiong Shengqing, Zhou Jianxin, et al. The research on quality evaluation method of test repeat lines in airborne gravity survey[J]. Chinese J Geophys, 2008, 5(5): 1538-1543. DOI:10.3321/j.issn:0001-5733.2008.05.028 |
[4] |
赵健, 刘展. 基于灵敏度分析的海洋油气资源BP神经网络预测模型的优化[J]. 海洋科学, 2016, 40(5): 103-108. Zhao Jian, Liu Zhan. Structure optimization of ocean oil and gas resources via BP neural network prediction model based on sensitivity analysis[J]. Marine Sciences, 2016, 40(5): 103-108. |
[5] |
陈科贵, 刘利, 陈愿愿, 等. BP神经网络在钻孔测井资料分类识别杂卤石中的研究[J]. 中国石油大学学报(自然科学版), 2016, 40(4): 66-72. Chen Kegui, Liu Li, Chen Yuanyuan, et al. Research on classification and discrimination of polyhalite with drilling and logging data by BP neural network[J]. Journal of China University of Petroleum (Edition of Natural Science), 2016, 40(4): 66-72. DOI:10.3969/j.issn.1673-5005.2016.04.008 |
[6] |
高隽. 人工神经网络原理及仿真实例[M]. 北京: 机械工业出版社, 2003. Gao Jun. Artificial Neural Network And Simulation Examples[M]. Beijing: Mechanic Industry Press, 2003. |
[7] |
武汉大学测绘学院测量平差学科组. 误差理论与测量平差基础[M]. 武汉: 武汉大学出版社, 2010. Survey Adjustment Group of School of Geodesy and Geomatics of Wuhan University. Error Theory and Foundation of Surveying Adjustment[M]. Wuhan: Wuhan University Press, 2010. |
[8] |
沈云中, 陶本藻. 实用测量数据处理方法[M]. 第二版. 北京:测绘出版社, 2012:165-178. Shen Yunzhong, Tao Benzao. Practical Methods for Surveying Data Processing[M]. 2th edition. Beijing:Surveying and Mapping Press, 2012:165-178. |