Abstract

1. Introduction

深度学习在地震事件检测与震相拾取中的应用

本研究的核心目标

数据集的多样性

深度学习模型的多样性

SeisBench 平台

技术实现


2. 数据与方法

2.1 任务与评估指标

模型在输入波形长度输出格式 方面存在差异。 定义了 三个通用任务,并为每个模型设定了适用于该任务的评估方式。

2.1.1 任务 1 —— 事件检测

任务定义

(1) 受试者工作特征曲线 (ROC) 和曲线下面积 (AUC)

(2) F1 分数

$$ F1 = 2 \times \frac{{\text{Precision} \times \text{Recall}}}{{\text{Precision} + \text{Recall}}} $$

2.1.2 任务 2 —— 震相识别 (Phase Identification)

任务定义

与任务 1(事件检测)的区别

评估指标

指标 衡量内容 作用
MCC(Matthews 相关系数) 计算混淆矩阵的相关性 适用于二分类问题,尤其适用于类别不均衡情况

2.1.3 任务 3 —— 震相到时拾取 (Onset Time Picking)

任务定义

评估方法

评估指标 作用
残差(Residuals) 预测到时 vs. 真实到时的误差
高残差比例 计算误差超过设定阈值(0.45s/1.5s)的样本占比
RMSE(均方根误差) 受离群值影响较大,适用于整体误差评估
MAE(平均绝对误差) 受离群值影响较小,适用于稳定性评估

2.2 数据集 (Datasets)

数据来源

本研究在 SeisBench 平台上使用了 八个数据集

数据集筛选

数据集 事件类型 适用于任务 备注
SCEDC 本地 & 区域地震 任务 1, 2, 3 超过 800 万条波形
ETHZ 本地 & 区域地震 任务 1, 2, 3 高质量人工标注
NEIC 远震 任务 2, 3 不适用于任务 1
LenDB 本地地震 任务 1 无人工 P/S 标注,排除任务 2, 3

数据标准化

2.3 已评估的模型概述

总结

模型名称 任务支持 输入长度 网络结构 训练数据 适用场景
BasicPhaseAE 事件检测、震相识别、震相拾取 6s(100 Hz) U-Net 智利 Iquique 11,000 震相数据 小型数据集,近场震相拾取
CRED 事件检测 30s(100 Hz) CNN + RNN 北加州 55 万地震 + 55 万噪声 长时窗口事件检测,低信噪比环境
DPP 事件检测、震相拾取 5s(100 Hz) CNN + Bi-LSTM 智利 Mw 8.1 & 7.7 震相数据 高噪声环境,数据有限场景
EQTransformer 事件检测、震相识别、震相拾取 60s(100 Hz) CNN + LSTM + Transformer STEAD 远震 & 复杂震相分析,自动化地震监测
GPD 事件检测、震相识别、震相拾取 4s(100 Hz) CNN 南加州 450 万地震波形 短时窗口震相分类,远震低频震相检测
PhaseNet 事件检测、震相识别、震相拾取 30s(100 Hz) U-Net 北加州 77.95 万震相数据 远震震相拾取,高噪声环境

2.4 训练部分

2.5 阈值和超参数选择

决策阈值选择

超参数优化

2.6 基准方法(Baseline)

1. P 波拾取基准方法

2. 参数优化

3. 未包含的基准方法


3. Results

3.1 任务 1 —— 事件检测 (Event Detection)

各模型表现分析

(1) PhaseNet vs. BasicPhaseAE

(2) EQTransformer vs. CRED

(3) GPD、PhaseNet 和 DPP 在 ETHZ 数据集上的优势

(4) EQTransformer 在 LenDB 和 GEOFON 数据集上的优势

影响模型表现的因素

影响因素 描述
信噪比(SNR) 低 SNR 数据集更难检测,AUC 评分更低
数据集标注方式 标注者不同,可能导致标注不一致,影响模型学习
数据质量控制 不同数据集质量控制不同,可能影响训练数据质量
模型输入窗口 长窗口(EQTransformer)适用于远震,短窗口(GPD)适用于本地地震

结论

3.2 任务2 —— 事件检测

1. 评估方法

任务难度分析

数据集 平均 MCC 任务难度
区域数据集(ETHZ, SCEDC, LenDB, INSTANCE, Iquique) 0.90 较易
NEIC 0.83 中等
GEOFON(远震数据集) 0.54 较难

主要结论

3.3 任务 3 —— 震相到时拾取 (Onset Time Determination)

1. 评估方法

2. P 波拾取表现

3. S 波拾取表现

4. 误差分析

5. 残差分布分析

3.4 任务 4 —— 跨域性能 (Cross-Domain Performance)

1. 评估方法

2. 主要发现

(1) 震中距相似的数据集,跨域泛化较好

(2) 区域数据集 → 远震数据集,泛化能力较差

(3) 远震数据集 → 区域数据集,泛化能力较差但比反向迁移稍好

(4) Iquique 和 LenDB 训练的模型跨域性能最差

(5) NEIC 和 GEOFON 数据集训练的模型表现出系统性偏差

(6) INSTANCE 训练的模型在所有任务中表现最佳

(7) STEAD、SCEDC、ETHZ 训练的模型在事件检测任务中表现相近

3. 震相拾取误差分析


4.Discussion

4.1 模型在波形示例上的比较总结

主要发现

4.2 采样率调整的跨域应用

主要发现

主要结论

4.3计算需求 (Computational Demand)

计算资源与硬件环境


5.开放问题

本章探讨了本研究的局限性,并提出了未来研究需要解决的关键问题,包括 连续数据分析、实时检测、数据集多样性、不同类型地震信号、传感器影响 以及 迁移学习的应用

5.1 研究局限性

1. 事件驱动分析 vs. 连续数据分析

2. 真实应用中的实时检测

5.2 未来数据集的构建

1. 需要涵盖更多类型的地震信号

2. 不同类型的地震仪器

3. 震相记录类型

5.3 迁移学习的应用

1. 迁移学习可提高跨域泛化能力

2. 迁移学习的优势

3. 迁移学习在地震学中的应用

4. 公开模型权重

5. 适用于小规模数据集

第六章 结论与建议 (Conclusions & Recommendations)

本研究对 六种深度学习模型地震检测(earthquake detection)、震相识别(phase identification)和震相拾取(onset time determination) 任务上的性能进行了系统评估。研究涵盖 本地/区域地震(6 个数据集)和远震(2 个数据集),并分别测试了 同域(in-domain)和跨域(cross-domain)性能。本章总结了主要研究发现,并对未来研究和应用提出建议。


6。研究结论

** 基准数据集的重要性**

研究贡献

1. 公开模型权重

2. 推荐决策阈值

主要结论

  1. PhaseNet、EQTransformer、GPD 在地震检测和震相拾取任务中表现最佳

    • PhaseNet 综合表现最优,适用于本地、区域和远震检测
    • EQTransformer 适用于远震数据,但需要避免 NEIC 训练的固定拾取位置问题。
    • GPD 事件检测能力强,但推理速度慢,仅适用于计算资源充足的环境
  2. 训练数据集的选择至关重要

    • STEAD 和 INSTANCE 适用于本地/区域地震检测
    • 远震数据训练的模型泛化能力较强,但本研究未能提供明确的远震数据推荐
  3. 迁移学习可以进一步优化模型性能

    • 通过微调预训练模型(fine-tuning),提高小规模数据集上的泛化能力
  4. 计算需求影响模型的实际应用

    • PhaseNet 和 CRED 计算需求较低,适用于实时应用
    • GPD 计算需求最高,推理速度慢,适用于小规模数据集
  5. 未来研究应优化模型的跨域泛化能力,改进数据集质量,并提升推理速度

Paper Link

转载请注明出处