海洋与湖沼  2022, Vol. 53 Issue (4): 972-980   PDF    
http://dx.doi.org/10.11693/hyhz20210900206
中国海洋湖沼学会主办。
0

文章信息

杜星, 孙永福, 董杰, 王青, 宋玉鹏, 苏志明, 张莞君. 2022.
DU Xing, SUN Yong-Fu, DONG Jie, WANG Qing, SONG Yu-Peng, SU Zhi-Ming, ZHANG Wan-Jun. 2022.
基于无监督机器学习的胶州湾海底工程环境适宜性综合评价
ASSESSMENT AND SUBDIVISION OF ENVIRONMENTAL SUITABILITY FOR SUBMARINE ENGINEERING IN THE JIAOZHOU BAY BY UNSUPERVISED MACHINE LEARNING
海洋与湖沼, 53(4): 972-980
Oceanologia et Limnologia Sinica, 53(4): 972-980.
http://dx.doi.org/10.11693/hyhz20210900206

文章历史

收稿日期:2021-09-08
收修改稿日期:2021-12-12
基于无监督机器学习的胶州湾海底工程环境适宜性综合评价
杜星1,2, 孙永福3, 董杰4,5, 王青4,5, 宋玉鹏1,2, 苏志明1, 张莞君1     
1. 自然资源部第一海洋研究所 山东青岛 266061;
2. 青岛海洋科学与技术试点国家实验室 海洋地质过程与环境功能实验室 山东青岛 266235;
3. 国家深海基地管理中心 山东青岛 266237;
4. 青岛地质工程勘察院(青岛地质勘察开发局) 山东青岛 266100;
5. 自然资源部滨海城市地下空间地质安全重点实验室 山东青岛 266100
摘要:海岸带工程地质环境的稳定性对于海洋工程的建设安全和沿海经济繁荣十分重要。在胶州湾海域已有地质、水文等数据的基础上, 对胶州湾海底工程环境适宜性进行了分区。通过无监督机器学习的谱聚类算法, 构建了胶州湾海底工程环境适宜性综合评价模型。结果表明, 胶州湾整体工程环境适宜性趋势为北高南低, 从北向南依次可分为适宜性高、适宜性较高、适宜性较低和适宜性低四个区域。相关性分析表明, 影响胶州湾海域海底工程适宜性的因素从高到低依次为冲淤分布、沉积物类型、坡度、第四系沉积物厚度、水深、海流流速、断裂分布。本研究可为胶州湾工程环境和地质灾害预防提供参考, 有助于海洋工程环境稳定和经济安全保障。
关键词胶州湾    海底工程    环境适宜性    无监督机器学习    综合评价    谱聚类    
ASSESSMENT AND SUBDIVISION OF ENVIRONMENTAL SUITABILITY FOR SUBMARINE ENGINEERING IN THE JIAOZHOU BAY BY UNSUPERVISED MACHINE LEARNING
DU Xing1,2, SUN Yong-Fu3, DONG Jie4,5, WANG Qing4,5, SONG Yu-Peng1,2, SU Zhi-Ming1, ZHANG Wan-Jun1     
1. The First Institute of Oceanography, MNR, Qingdao 266061, China;
2. Marine Geology and Environment Laboratory Process, Pilot National Laboratory for Marine Science and Technology (Qingdao), Qingdao 266235, China;
3. National Deep Sea Center, Qingdao 266237, China;
4. Qingdao Geo-Engineering Exploration Institute (Qingdao Geological Exploration and Development Bureau), Qingdao 266100, China;
5. Key Laboratory of Geological Safety of Coastal Urban Underground Space, Ministry of Natural Resources, Qingdao 266100, China
Abstract: The stability of the coastal engineering geological environment is essential for the construction safety of marine engineering and the prosperity of the coastal economy. Based on the existing geological and hydrological data in the Jiaozhou Bay waters, Qingdao, China, we divided the environmental suitability of the Jiaozhou Bay subsea engineering. Through the spectral clustering algorithm of unsupervised machine learning, a comprehensive evaluation model for the environmental suitability of Jiaozhou Bay subsea engineering was constructed. The results show that the overall engineering environmental suitability trend of Jiaozhou Bay is high in the north and low in the south. From north to south, it can be divided into four zones from high suitability to low suitability. Correlation analysis shows that the factors affecting the suitability of seabed engineering in Jiaozhou Bay are, from high to low, silting distribution, sediment type, slope, Quaternary sediment thickness, water depth, current velocity, and fault distribution. This study can provide reference for Jiaozhou Bay engineering environment and geological disaster prevention, and contribute to the environmental stability and economic security of marine engineering.
Key words: Jiaozhou Bay    submarine engineering    geo-environmental suitability    unsupervised machine learning    comprehensive evaluation    spectral clustering    

随着“海洋强国”战略的稳步实施, 海洋能源、海洋交通运输和海洋安全变得越来越重要, 港口、海上采油平台、海底管线等各类海洋工程设施也大量开工建设。然而各类海洋工程事故时有发生, 其原因大多是海床失稳或地基失稳(顾小芸, 2000)。通过综合评价的方法研究海底工程环境适宜性, 可以对研究海域工程地质稳定性进行区划并对潜在海底地质灾害影响进行预防, 具有重要的研究价值和指示意义。

近年来, 海域工程地质环境综合评价的研究越来越受到学者们的重视, 魏巍等(2013)通过层次分析法和模糊综合评价法对珠江口海域工程地质环境质量进行了综合区划; 杜东等(2019)利用专家打分法对河北曹妃甸岛区工程地质环境稳定性进行了评价; 宋晓帅等(2019)使用模糊综合评价方法对莱州湾海岸带工程地质环境进行了分区。以往学者们主要通过层次分析法、模糊综合评价、专家打分法等传统方法对海域工程地质环境进行综合评价, 在建模的过程中的人为指定权重、打分等行为可对结果造成较大的主观影响和不确定性, 同样的数据和模型不同的人为因素可以导致不同的结果, 对结果的客观性和准确性造成了一定影响。因此, 现在亟需减小人为因素影响, 使用新方法来进行更加客观的研究。

近年来, 人工智能方法在地质的各个领域已经取得了较好的运用, 如地震液化判别(Juang et al, 1999; 刘红军等, 2004; Ramakrishnan et al, 2008; Chern et al, 2008)、地表沉降预测(黄震等, 2017)、波浪作用下海床液化(Jeng et al, 2004; Cha et al, 2011)、滑坡危险性(Gordan et al, 2016; Chen et al, 2017; Marjanović et al, 2019; Nguyen et al, 2019; Shafizadeh-Moghadam et al, 2019; 杜星等, 2021)等方面, 然而对于海域工程地质环境综合评价的问题尚未有相关研究。因此, 本文引入了无监督机器学习中谱聚类的方法, 结合研究区地质、环境影响因子对胶州湾海域进行工程地质环境适宜性综合评价。研究结果可为胶州湾海域工程建设和地质灾害防护提供支撑和保障。

1 数据与方法 1.1 数据来源

研究区位于青岛市胶州湾海域(图 1), 研究数据主要来源于由自然资源部第一海洋研究所以往胶州湾相关项目报告以及相关学位论文(边淑华, 1999; 白伟明, 2005; 汪亚平, 2000), 主要包含了沉积物分布、地形坡度、第四系沉积厚度、水深、海流、冲淤和断裂。在进行综合评价计算前, 需要进行数据预处理, 将每种影响因子均根据研究区内数值分布特征分为2~4个级别, 详见下文(图 2)。

图 1 研究区位置及计算点位 Fig. 1 Location of the study area and calculation points
1.1.1 沉积物分布

研究区沉积物主要分为粉砂-黏土, 粉砂质淤泥, 砂, 砾石-基岩这4个大类。不同沉积物类型对应的工程性质存在区别。通常情况下承载力方面, 粉砂质淤泥 < 粉砂-黏土 < 砂 < 砾石-基岩。粉砂-黏土类沉积物主要分布在胶州湾内西北部区域, 该区域的特点为水动力作用最弱, 因此可以沉积黏土和淤泥类沉积物。粉砂质淤泥广泛分布于胶州湾内。砾石-基岩主要分布在胶州湾口, 是长期海流快速冲刷作用导致的结果。砂分布于湾口周边以及湾内东北部。

1.1.2 地形坡度

根据胶州湾海底地形坡度分布特点将其分为4个类别, 分别为: 坡度 < 0.25°、0.25° < 坡度 < 1°、1° < 坡度 < 2°、坡度 > 2°。胶州湾内大部分区域坡度 < 0.25°, 表明海底整体较为平坦。湾口区域坡度 > 2°, 是整个胶州湾坡度最大的区域, 表明了较强的水动力作用。0.25° < 坡度 < 1°和1° < 坡度 < 2°的区域依次分布于湾口外围, 表明了水动力作用逐渐减弱塑造的地形。

1.1.3 第四系沉积厚度

胶州湾内第四系沉积物厚度变化较大, 薄处仅0.5~1.0 m, 厚处达20余米。总地来说, 湾内东北部、西南部和东南部第四系较厚, 而中部、南部和西部较薄, 甚至基岩直接裸露海底, 厚度变化总趋势是南薄北厚。

研究区第四系沉积物厚度共分为4个范围: 0~5 m、5~15 m、15~25 m、> 25 m。受水动力作用影响, 胶州湾口区域第四系沉积物厚度最小, 整体位于5 m以内。沉积层厚度超过25 m的区域分布于湾内中部, 向外依次分布为15~25 m以及5~15 m厚度区域。

1.1.4 水深

研究区水深分为 < 5 m、5~10 m、10~15 m和 > 15 m四个级别。湾内地形总趋势是西北浅、东南深, 海底地势自北向南倾斜。水深大于15 m的区域主要位于湾口, 10~15 m位于湾口外围以及湾外区域。5~10 m水深范围位于10~15 m范围以外。湾内大部分低于水深小于5 m。

1.1.5 海流

胶州湾海流流速根据流速的数值分布特点主要分为流速小于0.3 m/s、0.3~0.5 m/s、0.5~1 m/s以及大于1 m/s四个级别。小于0.3 m/s的区域主要分布在胶州湾内近岸区域。0.3~0.5 m/s的区域覆盖了大部分胶州湾内部区域。0.5~1 m/s的区域主要分布在胶州湾口、湾口外围以及湾内东北部。大于1 m/s的区域分布在胶州湾口内部。

1.1.6 冲淤

研究区冲淤速率主要分为稳定区(−0.02 m≤年均冲淤量≤0.02 m)、轻微影响区(−0.05 m ≤年均冲淤量 < −0.02 m或者0.01 m < 年均冲淤量≤0.02 m)、中等影响区(−0.1 m≤年均冲淤量 < −0.05 m或者0.05 m < 年均冲淤量≤0.1 m)、严重影响区(年均冲淤量 < −0.1 m或者 > 0.1 m)。

胶州湾内绝大部分区域为稳定区, 表明了其工程环境的稳定性较高。轻微区分布于湾口外近黄岛海域、湾内东北部区域。冲淤程度中等区域主要分布于湾内中间区域。严重区域分布于轻微区域周边。

1.1.7 断裂

胶州湾内主要分布有大沽河-朝连岛断裂和沧口断裂。在断裂带分布的基础上, 将其向外延伸一定范围作为断裂面。其余海域范围为不受断裂影响区域。

1.2 谱聚类算法

谱聚类算法(spectral clustering)是一种典型的一种无监督机器学习算法, 主要应用于没有结果标签数据的分类。通过对研究数据的拉普拉斯矩阵的特征向量进行聚类, 从而达到对样本数据聚类进而分类的目的。谱聚类算法可将高维空间的数据映射到低维空间, 然后在低维空间用其他聚类算法进行聚类。与最常用的k-means聚类方法相比, 谱聚类算法使用了降维技术, 更加适用于高维数据的处理, 同时对处理稀疏数据更为有效。海底工程环境适宜性综合评价的输入因子类别多、数据不集中, 因此, 采取谱聚类算法比传统的聚类方法更为适用。谱聚类通过输入n个样本点X={x1, x2, …, xn}和聚类簇的数目k, 最终输出聚类簇A1, A2, …, Ak。具体算法步骤为:

(1) 计算n×n的相似度矩阵W (包括最小邻近值法、k临近法及全连接法), 下式为本文使用的全连接法表达式:

    (1)

式中, sij组成的相似度矩阵W, 核函数参数σ控制着样本点的邻域宽度, 即σ越大表示样本点与距离较远的样本点的相似度越大;

(2) 计算度矩阵D, 即相似度矩阵W的每一行元素之和, Ddi组成的n×n对角矩阵;

    (2)

(3) 计算拉普拉斯矩阵L=DW;

(4) 计算L的特征值, 将特征值从小到大排序, 取前k个特征值, 并计算前k个特征值的特征向量ui, u2, …, un;

(5) 将上面的k个列向量组成矩阵U={ui, u2, …, un}, URn×k;

(6) 令yiRkU的第i行的向量, 其中i=1, 2, …, n;

(7) 使用k-means算法将新样本点Y={y1, y2, …, yn}聚类成簇C1, C2, …, Ck;

(8) 输出簇A1, A2, …, Ak, 其中Ai={j|yiCi}。

以上为谱聚类算法的描述。即先根据样本点计算相似度矩阵, 然后计算度矩阵D和拉普拉斯矩阵L, 然后计算拉普拉斯矩阵前k个特征值对应的特征向量, 最后将这k个特征值对应的特征向量组成的矩阵U, U的每一行成为一个新生成的样本点, 对这些新生成的样本点聚成k类输出聚类的结果。

1.3 研究方法

由于海底工程环境适宜性的环境影响因素、触发因子众多且难以实时监测, 进而无法使用各类地质参数与地下空间开发适宜性之间对应的结果进行有监督学习, 因此, 本项目通过无监督学习方法为基础建立胶州湾海底工程环境适宜性评价模型。使用谱聚类算法对地下空间开发适宜性开展适宜性评价, 主要分为输入输出参数类别确定、原始数据处理、核函数参数选取以及评价四个部分。

1.3.1 输入、输出参数类别

海底工程环境适宜性影响因素众多, 主要可以分为内因和外因, 其中内因是海底沉积物自身的物理力学性质; 外因则受不同地质环境的影响存在多样性。本研究区的内因主要有沉积物类型、海底地形坡度、第四系沉积物厚度, 表征了海底沉积物自身条件; 外因为水深、流速、冲淤以及断层分布情况。自然资源部第一海洋研究所在以往项目观测发现, 胶州湾内波浪主要为短风区浅水风浪, 波高普遍较小(1~2 m, 仅在台风来临时最大可至3 m), 外海波浪影响作用仅限于湾口以内的前湾一带, 在湾内大部分区域几乎不产生影响, 因此, 并未把波浪选作本研究区工程适宜性评价的影响因素。另外, 将区域评价结果分为4类是评价分级较为常用的一种方式。因此本研究中输入节点数为7个, 对应输入类别的9个参数; 输出节点数为4个, 分别为适宜、较适宜、较不适宜和不适宜(图 3)。选定评价单因子后, 综合考虑需结合区域地质环境参数分布特征进行分类, 得到单因子评价分级图。

图 3 海底工程环境适宜性评价网络示意图 Fig. 3 The network structure of environmental suitability assessment on submarine engineering 注: 不同颜色线条表示不同权重的示意
1.3.2 原始数据处理

根据图 1所示计算点位, 按照研究点位的坐标分别从输入参数中获取相对应的数据。文中所使用的7个输入参数的数据已按照不同参数类型及数据特点分为了4个级别, 因此, 提取出的每个研究点位对应着7个参数, 每个参数的数值为1~4的不同类别。每个坐标点均对应着7个单因子的分级结果。

1.3.3 核函数参数选择

本文计算相似度矩阵式使用全连接方法, 其中核函数为高斯核函数(数值大于0)。对核函数进行调参时, 保持数据及其他网络参数不变, 令核函数参数为从0.01至2.0, 以0.01为间隔进行变化, 针对每个核函数参数均进行聚类并使用Calinski-Harabasz评分标准对结果进行打分, 选择评分最高时的核函数参数作为评价网络最终的参数。

1.3.4 海底工程环境适宜性评价

使用确定了输入、输出参数类别、网络参数后可得到最终的地下空间开发适宜性无监督学习评价网络, 使用该网络对研究点位数据进行无监督机器学习方法训练可获得研究点位的地下空间开发适宜性评价结果。

2 结果 2.1 模型参数选择

通过对不同的核函数参数展开地下空间开发适宜性聚类分析后, 基于Calinski-Harabasz评分标准的得分结果见图 4。随着核函数参数逐渐增加, 聚类效果得分先减小后增加, 在核函数参数为0.77时具有最大的得分1 504.24。因此选择核函数参数值为0.77作为地下空间适宜性评价网络的最终参数。

图 4 评价网络得分随核函数参数的变化 Fig. 4 Evaluation of network scores with kernel function parameters 注: 得分越高, 表明聚类效果越好, 得分最高所对应核函数参数周边一定范围内均可作为模型参数
2.2 综合评价结果

使用建立的无监督机器学习模型对胶州湾海底工程环境适宜性进行了评价, 结果见图 5。整个研究区可分为适宜性高、适宜性较高、适宜性较低和适宜性低4个区域。

图 5 胶州湾海底工程环境适宜性评价结果 Fig. 5 Environmental suitability of submarine engineering in the Jiaozhou Bay
2.2.1 适宜性高

位于胶州湾内近岸海域, 区内大部分区域断裂构造不发育, 区域构造稳定性良好, 海底地形平坦, 地质类型以粉砂淤泥为主, 部分区域为黏土, 区内水动力条件较弱, 以沉积作用为主, 潮流流速通常小于0.3 m/s, 存在一定冲淤现象, 水深小于10 m, 波浪对海底工程设置的影响较小, 海底工程环境适宜性良好。

2.2.2 适宜性较高

分布于胶州湾中心区域, 断裂构造发育, 海底地形相对平坦, 底质类型以粉细砂、粉砂质黏土为主。区域内部水动力条件比适宜区强, 水深也小于10 m, 流速介于0.3~0.5 m/s之间, 海底工程环境适宜性较好。

2.2.3 适宜性较低

主要分布于胶州湾口周边及湾内东北部区域, 区域内部基岩埋深较浅, 断裂构造发育, 海底地形欺负较大, 水动力作用较强, 潮流流速一般大于0.5 m/s, 水深大于10 m, 海底冲蚀作用较强。在该区内修筑海底工程物、铺设海底管道或电缆时须注意潮流的冲刷作用, 并采取必要的防护措施。此区水深, 海底障碍少, 是胶州湾内航道的良好出口。

2.2.4 适宜性低

适宜性低的区域主要分布于胶州湾口, 呈南北向条带状分布。是胶州湾内较大断裂构造密集带和交汇处。区内基岩裸露, 海底地形起伏大, 水深最深可达60余米。区域内部水动力作用最强, 潮流流速大, 部分区域大于1 m/s, 海底冲刷作用强烈, 基岩稳定性较差, 是胶州湾内海底地下空间适宜性最差的区域, 在工程规划设计时应尽量避开。

3 讨论 3.1 评价结果分析

研究区内海底工程环境适宜性结果显示, 整体上从胶州湾口向北至胶州湾内部, 工程环境适宜性越来越高。而随着由南向北, 水动力作用越来越弱, 则冲刷作用也越来越弱, 冲刷作用减弱, 部分地区出现了淤积(图 2f)。如图 2c显示, 现有第四系沉积物厚度也呈现北厚南薄的状态。综合上述条件, 因此工程环境适宜性综合评价结果整体上为从北至南适宜性逐渐降低。对于大多数从地质环境条件上分析, 湾口处水动力最强, 冲刷最强烈, 经过多年作用后基本为基岩裸露, 不适宜海底电缆、光缆、管道等一系列海底工程设施的铺设。

图 2 胶州湾海底工程环境适宜性评价单因子分级 Fig. 2 Single-factor classifications of environmental suitability assessment on submarine engineering in Jiaozhou Bay 注: a为沉积物类型单因子分级; b为水深单因子分级; c为第四系沉积物厚度单因子分级; d为坡度单因子分级; e为海流单因子分级; f为冲淤单因子分级; g为断裂分布单因子分级

贾永刚等(1999)对胶州湾工程地质环境质量综合评价进行了区划, 根据模糊综合评判结果, 将胶州湾内划分为4个不同等级工程地质环境质量区。工程地质稳定区位于胶州湾内近岸海域; 次稳定区分布于胶州湾中心地段; 次不稳定区位于胶州湾口一代; 不稳定区位于胶州湾口黄岛至团岛一线中心。该研究结果与本文分区结果整体上保持一致, 均为从北到南工程环境适宜性依次减小, 且稳定、次稳定区域的范围也与本文较为一致, 表明了本文计算结果的准确性。存在主要的区别在于, 贾永刚划分的工程地质环境不稳定区仅存在与黄岛-青岛中间位置的区域, 包围在工程地质环境次不稳定区域之内。而本文分区结果显示, 适宜性低的区域从湾内延伸至湾外, 相比之下覆盖的范围明显增加。由图 2观察可知, 胶州湾口位置沉积物类型、坡度、第四系沉积物厚度、水深、海流分布情况均不利于海底工程环境的实施和保护, 并且不适宜和较不适宜的分布范围普遍从湾口一直向内延伸至湾内、向外延伸至市南、崂山区海域一带。另外, 模糊评判建模过程中需要依赖专家进行权重的赋予, 而本文的机器学习方法完全不依赖人为因素。综合上述因素, 目前适宜性低的区域分布范围与20 a前相比增加了较大范围。

3.2 影响因子重要性

通过R语言对海域地下空间开发适宜性评价结果与各类单因子进行相关性分析, 结果如图 6所示。整体上沉积物、坡度、第四系沉积物厚度、水深、流速与分区结果呈正相关; 冲淤以及断裂与分区结果呈负相关。相关性从高到低排列依次为: 冲淤、水深、坡度、第四系沉积物厚度、沉积物、流速、断裂。

图 6 胶州湾海底工程环境适宜性相关性分析 Fig. 6 Correlation analysis of environmental suitability of seabed engineering in the Jiaozhou Bay 注: 从深红至深蓝色表示了相关性系数从−1到1的变化情况, −1表示完全负相关、1表示完全正相关, 圆圈越大表示了相关性越强

冲淤为本研究区对开发适宜性影响最大的因素, 综合评价结果也可看出适宜性结果与冲淤的相似性。沉积物类型、坡度、第四系沉积物厚度、水深为对本研究区开发适宜性影响中等的因素, 相关性系数均在−0.2左右, 几种因素的影响程度相差不大。海流流速的相关性系数为−0.1, 说明影响因素较小, 原因可能是由于长期以来的海流冲刷, 使得研究区内易于冲刷的区域已经冲刷达到稳定。断裂为−0.01, 对分区结果影响最小, 说明研究区内分布的几条断裂带只能影响局部区域, 对整体的分区影响还是很小。

3.3 评价模型分析与展望

综合评价模型得到的区域适宜性高低, 主要代表了是否适宜开展各类工程设施的开发建设、工程设施后期稳定运行维护以及潜在地质灾害影响性等方面。通常来说, 波浪越小、海流越小、海底越平坦、冲刷现象越弱, 工程适宜性越高。而水动力作用越强、水深越大、断层分布越多等情况会导致工程适宜性差。使用无监督机器学习算法根据参数特点划分不同的区域后, 需根据每个区域内的地质参数特点指定该区域对应的工程适宜性类型。本研究主要针对的适宜性主要考虑了施工难易程度、海底工程地质环境稳定性以及工程后期的稳定性。

无监督机器学习模型进行综合评价时, 与传统评价方法相比有更加客观的属性。使用传统方法(如层次分析法)时, 不仅需要人为选定影响因子和数据预处理分级, 还需要指定两两比较构造判断矩阵、赋予权重。同样的数据资料不同的专家进行赋予权重时结果不一样, 且当影响因子较多时, 难以人为给出合理的判断矩阵。而本文使用的方法, 只需要选定影响因子并将其进行数据预处理分级, 不需要人为赋予权重。基于无监督机器学习算法可以根据不同影响因子的类型和特点, 自动将研究点位划分为不同属性值。当然, 该方法不可能完全不受人为因素影响, 只是与传统评价算法相比减小了赋予权重和两两比较等步骤。因此, 本文使用的方法具有更大的客观优势。

关于综合评价中影响因子的选择, 数据类型越全面、资料越丰富、数据精度越高越有利于评价的准确性。然而对于海域研究区往往难以获得涵盖所有地质环境数据的资料, 即使在该海域进行过一定数量的项目研究, 也无法保证影响因素类型和数据量的全覆盖。因此, 在考虑综合评价因子选择时, 要遵循以下几点。(1) 完整性: 涵盖研究区各类地质环境参数; (2) 易获取性: 影响因子较为常见和易得, 不可为难以获得或偶然获得的参数, 否则不具有重复性和复制性; (3) 无明显不相关性: 需进行筛选, 去掉明显无影响的因子。因此, 本文在选择影响因子时通过搜集以往项目中的各类数据, 综合考虑了内因和外因选定了7个影响因子。该7个影响因子基本涵盖了研究海域的内外影响因素、在研究和调查中较为容易获得且无明显不相关性, 因此, 较为合理。同时与前人的研究结果(贾永刚等, 1999)进行比较后, 整体趋势较为一致。当前限制人工智能准确性的最重要因素即为数据量和数据丰富程度, 因此, 大数据一直是与人工智能分不开的。像台风、海啸、地震等参数, 增加为影响因素后会丰富结果的完整性, 也可能对准确性有一定贡献, 但受目前数据丰富程度的限制暂时无法增加。随着未来数据量的丰富和增加, 综合评价模型的完善性和准确性会越来越高。

4 结论

本文通过无监督机器学习的方法, 构建了胶州湾海底工程环境适宜性综合评价方法, 通过对研究区各类地质、环境条件进行分级和计算, 获得了海底工程环境适宜性的评价结果, 并就分区结果与单因子影响性程度进行了讨论, 主要得到以下结论:

(1) 使用无监督机器学习算法可以对胶州湾海底工程环境适宜性综合评价问题进行准确的分类, 当网络中含有7个输入节点、4个输出节点、核函数参数为0.77时, 具有最佳的分区效果;

(2) 胶州湾海底工程环境适宜性整体呈北高南低的趋势, 适宜性高的区域位于湾内最北部近岸海域, 适宜性较高的区域位于湾内适宜性高区域以南, 适宜性较低的区域位于湾口周边及湾内东北部区域, 适宜性低的区域分布于胶州湾口及周边区域;

(3) 研究区内海底工程适宜性最大的影响因素是冲淤分布, 影响性中等的是沉积物类型、坡度、第四系沉积物厚度、水深, 影响性较小的是海流流速, 影响程度很小的因素为断裂分布。

参考文献
白伟明, 2005. 胶州湾工程地质环境特征研究[D]. 青岛: 中国海洋大学: 17-23.
边淑华, 1999. 胶州湾环境演变与冲淤变化[D]. 青岛: 国家海洋局第一海洋研究所: 25-28.
刘红军, 薛新华, 2004. 砂土地震液化预测的人工神经网络模型. 岩土力学, 25(12): 1942-1946, 1950 DOI:10.3969/j.issn.1000-7598.2004.12.016
刘保华, 吴金龙, 李西双, 等, 2007. 海域控制性浅层地震勘探报告[R]. 国家海洋局第一海洋研究所. (查阅所有网上资料, 未找到本条文献信息, 请联系作者确认)
杜东, 柳富田, 刘宏伟, 2019. 河北曹妃甸岛区工程地质环境稳定性评价研究. 地质调查与研究, 42(4): 299-304 DOI:10.3969/j.issn.1672-4135.2019.04.011
杜星, 孙永福, 宋玉鹏, 等, 2021. 基于谱聚类算法的海底滑坡危险性评价. 海洋学报, 43(1): 93-101
汪亚平, 2000. 胶州湾及邻近海区沉积动力学[D]. 青岛: 中国科学院海洋研究所: 18-19.
宋晓帅, 于开宁, 吴振, 等, 2019. 莱州湾海岸带工程地质环境质量分区. 海洋地质与第四纪地质, 39(2): 79-89
贾永刚, 孙永福, 单红仙, 1999. 胶州湾工程地质环境质量综合评价区划. 海洋地质与第四纪地质, 19(3): 121-126
顾小芸, 2000. 海洋工程地质的回顾与展望. 工程地质学报, 8(1): 40-45 DOI:10.3969/j.issn.1004-9665.2000.01.008
黄震, 赵奎, 许宏伟, 等, 2017. 基于SA-BP神经网络的软土基坑开挖地表沉降预测[C] // 2017年全国工程地质学术年会论文集. 桂林: 《工程地质学报》编辑部.
魏巍, 李培英, 马媛, 等, 2013. 珠江口海域工程地质环境质量综合评价区划. 热带海洋学报, 32(6): 58-62 DOI:10.3969/j.issn.1009-5470.2013.06.009
CHA D, ZHANG H, BLUMENSTEIN M, 2011. Prediction of maximum wave-induced liquefaction in porous seabed using multi-artificial neural network model. Ocean Engineering, 38(7): 878-887
CHEN W, POURGHASEMI H R, KORNEJADY A, et al, 2017. Landslide spatial modeling: introducing new ensembles of ANN, MaxEnt, and SVM machine learning techniques. Geoderma, 305: 314-327
CHERN S G, LEE C Y, WANG C C, 2008. CPT-based liquefaction assessment by using fuzzy-neural network. Journal of Marine Science and Technology, 16(2): 139-148
GORDAN B, JAHED ARMAGHANI D, HAJIHASSANI M, et al, 2016. Prediction of seismic slope stability through combination of particle swarm optimization and neural network. Engineering with Computers, 32(1): 85-97
JENG D S, CHA D, BLUMENSTEIN M, 2004. Neural network model for the prediction of wave-induced liquefaction potential. Ocean Engineering, 31(17/18): 2073-2086
UANG C H, CHEN C J, 1999. CPT-based liquefaction evaluation using artificial neural networks. Computer-Aided Civil and Infrastructure Engineering, 14(3): 221-229
MARJANOVIĆ M, SAMARDŽIĆ-PETROVIĆ M, ABOLMASOV B, et al, 2019. Concepts for improving machine learning based landslide assessment [M] // POURGHASEMI H R, ROSSI M. Natural Hazards GIS-Based Spatial Modeling Using Data Mining Techniques. Cham: Springer.
NGUYEN V V, PHAM B T, VU B T, et al, 2019. Hybrid machine learning approaches for landslide susceptibility modeling. Forests, 10(2): 157
RAMAKRISHNAN D, SINGH T N, PURWAR N, et al, 2008. Artificial neural network and liquefaction susceptibility assessment: a case study using the 2001 Bhuj earthquake data, Gujarat, India. Computational Geosciences, 12(4): 491-501
SHAFIZADEH-MOGHADAM H, MINAEI M, SHAHABI H, et al, 2019. Big data in geohazard; pattern mining and large scale analysis of landslides in Iran. Earth Science Informatics, 12(1): 1-17