摘要

  1. 研究背景与问题
    地震震相拾取是地震数据自动化处理中至关重要的步骤,主要包括信号检测、震相到时估计和震相识别等过程。震相拾取的准确性直接影响到后续的事件关联处理和观测报告的质量。当前,传统的地震震相拾取方法在准确性和效率上可能面临一定的挑战,因此需要新技术来提升处理效果。

  2. 研究目标与方法
    为了提高震相拾取的准确性,本文采用了深度卷积神经网络(CNN),尤其是多任务卷积神经网络(Multi-task CNN),来解决这一问题。模型不仅用于震相的检测和识别,还能准确估计到时。为了优化训练过程,作者设计了联合损失函数,其中包括了基于加权的分类损失函数,旨在提高模型对震相数据的准确识别。

  3. 实验与结果
    采用美国南加州地震台网的200万条震相数据进行训练、验证和测试。研究结果表明,测试集中P、S震相的识别查全率分别达到了98%以上,震相到时估计的标准偏差分别为0.067秒和0.082秒。
    接着,研究采用了迁移学习和数据增强技术,成功将模型应用到我国东北地区台网的数据集上。在这个数据集上,P、S震相的查全率分别为91.21%和85.65%,虽然与南加州的数据集相比有所下降,但依然具有较高的应用潜力。

  4. 应用与验证
    基于迁移学习训练后的模型,本文进一步设计了一个用于连续数据的震相拾取方法。通过在实际地震数据上进行测试,发现该方法的震相检测识别率平均可达到84.5%。与国家数据中心和中国地震局的观测报告对比,表明该方法在实际应用中的有效性和可行性。

0 引言

  1. 神经网络方法与其应用背景
    神经网络方法通过映射函数实现了数据的非线性映射,从而能够应对复杂的分类和回归任务。早期的人工神经网络受限于计算能力,无法充分发挥其优势,直到云计算与大数据的兴起,才为深度学习的发展奠定了基础。随着计算资源的提高和数据集的扩展,深度学习得以更好地应用,特别是在计算机视觉等领域中表现出色,推动了包括图像识别、语音识别和自然语言处理等任务的突破。

  2. 卷积神经网络(CNN)的构成与特点
    卷积神经网络(CNN)利用局部连接和权重共享的特性,大大减少了网络中的参数量,使其在处理图像、语音等高维数据时更加高效。通过卷积层提取局部特征,池化层减少数据的维度,CNN能够逐步学习数据中的层次化特征。这种结构使得CNN在图像分类、目标检测等任务中展现出强大的优势,是深度学习领域的重要突破。

  3. 地震数据自动处理的挑战与现有方法
    地震数据自动处理中的震相拾取问题至关重要,不同的方法各有优缺点。传统的 STA/LTA 方法因其简单高效,但对于弱信号的检测存在局限;而基于AR-AIC的震相到时估算方法虽然效果较好,但在低信噪比条件下的表现较差。这表明,在地震信号处理任务中,单一方法往往难以应对所有场景,需要综合多种技术来提升检测精度。

  4. 深度神经网络在地震震相拾取中的应用
    深度神经网络,尤其是卷积神经网络(CNN),已成为解决地震震相拾取问题的重要工具。与传统方法相比,CNN能够处理更加复杂的数据模式,提升震相识别和事件检测的精度。深度学习方法通过自动学习数据中的特征,减少了对人工特征提取的依赖,且在实时性和准确性上均表现出较大优势,尤其在复杂和大规模地震数据的处理方面有显著提高。

  5. 本文的研究贡献与方法
    本文提出的多任务卷积神经网络模型,通过结合分类和回归任务的方式,提升了震相拾取的准确性。利用大量的震相数据进行训练与测试,并通过迁移学习将模型应用于不同地区,验证了该方法的广泛适用性。最终,本文所提出的模型不仅在模拟数据集上表现出色,还能在实际的连续地震数据中应用,具有较强的实际应用潜力。


总的来说,本文通过引入卷积神经网络(CNN)技术,突破了传统方法在地震震相拾取中的局限性。深度学习的引入,尤其是在数据量增加和计算能力提升的背景下,为地震信号的自动识别、分类和时刻估计提供了新的解决方案,具备了良好的应用前景。

1 数据和方法

1.1 数据集及预处理

本文所使用的数据集由 Ross 等(2018)进行过预处理,数据来源于美国南加州地震数据中心

包括了美国南加州地震台网2000年至2017年间的200万条近震波形,数据来源于692个宽频带和短周期台站。
数据包含三分量事件波形,震相主要是直达P波和S波,噪声数据为信号检测前5秒的数据。
数据的采样率为100Hz,数据截取以震相到时为中心,窗口长度为4秒。数据预处理包括去除线性趋势、0.1~20Hz的带通滤波,并对每段数据进行归一化处理。

此外,研究还从中国地震局地球物理研究所获取了东北地区包括牡丹江、延边、长白山、宽甸、沈阳和长春等6个台站2013-2018年的震相数据和原始波形数据。
数据包含1938个近震事件,台站和事件位置图,事件震级分布图。根据震相到时对数据进行截取,并进行去线性、滤波和归一化处理,作为后续迁移学习的输入数据。

1.2 卷积神经网络设计

本文主要解决震相拾取问题,包括震相检测识别和到时估计,这些任务通过直接学习三分量台站数据来完成。
该问题与图像识别中的目标检测和定位任务类似,首先需要检测和识别震相是否存在,然后估算震相的起始时间。
多任务卷积神经网络(CNN)可以有效实现这一任务。输入数据为三分量台站的波形数据,输出分为两个部分:一个用于震相分类,实现震相的检测和识别(P、S、N),采用分类方法;另一个用于预测到时,采用回归方法。
由于震相类别和其到时之间具有相关性,建立一个卷积神经网络模型能够学习到准确的表示,帮助实现震相的识别和到时的预测。

......

3 应用

3.1 迁移学习分析与总结

1. 迁移学习的基本概念与应用

迁移学习(Transfer Learning)是深度学习中的一个重要研究方向,其核心思想是将一个在大规模数据集上训练得到的模型,通过微调应用到与之相关的其他任务中。与传统的深度学习方法不同,迁移学习能够有效地解决小数据集训练问题,尤其是在数据量稀缺时,能够借助预先训练的模型提取通用特征,减少对大量标注数据的依赖【Tan et al., 2018】。

在地震震相拾取任务中,由于不同台站和地区的地质条件差异,台站记录的震相数据在某些特征上具有一定的相似性,但也存在差异。尤其是在震相识别任务中,传统的模型训练通常依赖于大量的高质量数据,但在一些区域(如东北地区),可用的标注数据较为有限。因此,迁移学习提供了一种有效的解决方案,它可以将已经在大规模数据集上训练好的模型应用到数据相对匮乏的目标区域,通过调整部分模型参数,从而提高小数据集的训练效果。

2. 迁移学习在震相拾取中的应用

本研究采用了迁移学习和数据增强相结合的方法,通过迁移学习将南加州地震台网训练得到的深度学习模型应用到我国东北区域的部分台站数据上。迁移学习的实现过程主要包括两个步骤:首先将已训练的模型卷积层冻结,保持其参数不变;然后,针对新任务的特点(即东北区域震相数据),重新训练全连接层的参数。

为了防止数据过少引发的过拟合问题,研究者还采用了数据增强技术,通过对原始训练样本进行平移和加噪处理,生成更多的训练数据。这些增强数据包括平移操作(时间窗口内震相波形数据的位移)和高斯噪声的添加,旨在提高模型的泛化能力,降低模型对少量训练样本的过拟合风险。

3. 数据增强的具体实现

数据增强是解决小样本学习问题的一种有效手段。在本研究中,数据增强通过平移和加噪方法,显著扩展了训练集的大小。通过这种方式,从东北地区的六个台站获取的6500条震相数据(包括P波和S波震相及噪声数据)被扩展至13000个样本。这些样本经过随机打乱,分为训练集(80%)和验证集(20%),进一步进行模型训练和评估。通过对全连接层的重新训练和数据增强的结合,模型得到了更好的泛化能力,有效地避免了过拟合。

4. 迁移学习和数据增强的效果

在训练过程中,迁移学习方法使得模型能够从南加州地震台网的训练经验中迁移过来,并在东北地区的少量数据上进行微调。最终,训练集的性能表现良好,验证集的损失值达到了最小值0.30,且训练时间较短,表明该方法对于少量数据的处理能力较强。测试集的P波和S波震相识别的查全率和查准率也达到了较高水平(P波分别为91.21%和93.01%,S波分别为85.65%和98.91%),优于现有的IDC方法,表现出优秀的检测效果。

图8展示了不同震相信噪比的分布,结果表明该方法能够较好地应对低信噪比信号的震相识别,尤其是对于小规模地震事件,仍能保证较高的检测准确性。图9显示了部分震相的拾取情况,除了个别低信噪比的P波震相被误判为噪声,其他震相的识别均为准确。P波和S波的到时估计误差的均值和标准差分别为P波-0.117s、0.264s,S波-0.077s、0.169s,显示出与之前方法相比,性能虽然略有下降,但依然具有较好的效果。

5. 模型迁移的优势与挑战

迁移学习的一个重要优势在于,它能将源领域(如南加州地震台网)的训练经验迁移到目标领域(如东北地区台站),并通过微调和数据增强来克服数据匮乏的问题。这使得模型能够在数据稀缺的情况下,依然获得较好的性能。然而,模型迁移的效果依赖于源领域和目标领域的相似度,尤其是在地质结构和震相特征相似的情况下,迁移效果较为显著。如果两者之间的差异过大,可能需要更多的适应性调整。

本研究中的迁移学习方法,尤其是通过冻结卷积层和重新训练全连接层的策略,能够有效地保留源领域中学到的通用特征,同时针对目标任务的具体要求进行优化。这种方法在处理类似地震数据这样的任务中,展现了较强的灵活性和鲁棒性。

转载请注明出处