ABSTRACT
本文提出多任务地震监测模型 EffiSeisM,在单一框架中同时完成地震检测、P/S 相拾取与震级估计。
- 模型结构:
- 使用 Seismic Scale Conv (SSC) 模块 进行多尺度卷积特征提取(结合样条 / RBF 映射),适应地震波形多频、多尺度特性。
- 使用 Conv-SSM 编码器 将卷积特征与线性状态空间模型(SSM)结合,既建模长程时序依赖,又保持线性时间复杂度。
- 数据与指标:
- 在 DiTing 与 DiTing 2.0 两个中国区域大规模数据集上训练和评估,总样本量约 300 万条三分量波形。
- 主要结果: - 地震检测 F1 ≈ 0.98 - P 相拾取 F1 ≈ 0.92 - S 相拾取 F1 ≈ 0.84 - 震级估计决定系数 $R^2 ≈ 0.92$
- 传统方法局限:
- 传统 STA/LTA、AR 模型和基于人工特征的神经网络在强噪声、复杂多尺度情形下泛化能力有限。
- 震级估计通常依赖最大振幅 + 距离修正表,对不同震型和噪声环境的适应性不足。
- 深度学习与多任务动机:
- 深度学习在检测、拾取、震级预测等任务上已展现出显著优势,但大多针对单一任务。
- 检测、拾取与震级估计内在耦合,适合用 多任务统一模型 共享表征、减少冗余。
1. Introduction
-
核心任务及挑战:
- 任务:地震检测、相位拾取(P/S 到时)、震级估计,三者内在耦合。
- 信号特性:P/S 传播速度与振幅不同,频带覆盖宽(大震低频、小震高频)。
- 难点:高噪声、信噪比波动大、高时间分辨率 → 大规模分析的计算负担重,且易影响拾取和震级精度。
-
传统方法与局限:
- 检测:以 STA/LTA 及其改进、AR 模型、手工特征 + NN 等为代表。
- 震级:依赖最大振幅与震中距的经验相关,并通过距离校正表修正。
- 局限:对多样地震事件和复杂噪声环境的泛化能力不足,参数与阈值需频繁人工调节。
-
深度学习进展:
- 标注波形数据增多,深度学习模型可以端到端提取 P/S 相、震级等特征。
- 在检测、拾取、震级预测方面已有多种成功模型(如 PhaseNet 系、Transeis、SeisParaNet、SeisT 等)。
- 但现有工作多是单任务或侧重特定场景,对“高效多任务地震监测”的系统优化仍然有限。
-
本文贡献与模型理念:- 提出高效多任务深度学习框架 EffiSeisM: - 结构上结合卷积模块与线性状态空间模型(SSM),适合长序列建模 - SSM 用于高效捕获波形时间依赖与动态特征,卷积用于局部与多尺度特征提取。
2.1 Model structure 小结
- EffiSeisM 由三部分组成:Seismic Scale Conv (SSC) 模块、Conv-SSM Encoder 模块和 Forecast Layer。
- 前端负责预处理和多尺度卷积编码,中间层负责长程时序建模,后端负责多任务输出(检测/拾取/震级)。
-
预处理与数据增强:
- 采用随机裁剪、时间平移和振幅归一化等操作。
- 目的:模拟真实环境中的噪声与震级/震中距/场地条件差异,提升模型跨区域、跨工况的鲁棒性。
-
SSC 模块(Seismic Scale Conv):
- 结合传统卷积与样条卷积,针对地震波形的多尺度和长序列特性。
- 通过时间下采样 + 通道升维:
- 降低后续计算量。
- 提升模型对复杂地震特征的表达能力。
-
Conv-SSM Encoder 模块:
- 包含 Fast Scale Conv (FSC) 层与 State Space Model (SSM) 层。
- FSC 层:
- 并行多种卷积核尺寸,捕获从高频到低频的宽频带特征。
- 适应不同震级、震中距和局部地质引起的波形差异。
- SSM 层:
- 用线性状态空间方程高效建模长程时间依赖。
- 相比 RNN/LSTM 训练更稳定、梯度问题更小;相比 Transformer 复杂度更低、长序列更高效。
- 具有选择性机制,可强调有用时序模式、抑制噪声,提高复杂/高噪环境下的特征可分性。
-
Forecast Layer 与多任务输出:
- 共享骨干(SSC + FSC + SSM),在其上分成不同任务分支。
- 检测与相位拾取:
- 使用上采样 + 卷积恢复时间分辨率,输出逐时间采样点的精细预测。
- 震级估计:
- 使用全局池化提取全事件特征,再通过回归层输出标量震级。
- 不同任务采用任务特定损失函数独立优化,同时共享统一的地震波形表征。
2.2 Seismic Scale Conv (SSC)
-
物理与信号背景:
- 地震波形具有宽频带、多尺度特征,不同频段携带震源、震级、传播过程等关键信息。
- 传统单尺度卷积难以同时捕获粗粒度与细粒度特征,容易丢失多尺度信息。
-
设计思想:
- SSC 将 多尺度卷积 与 样条卷积 + RBF 非线性映射 结合:
- 多尺度卷积负责不同时间尺度 / 频段。
- RBF 负责将波形映射到非线性高维空间,提升复杂波形和不同噪声条件下的可分性。
- 同时在时间维进行下采样,在通道维扩展特征数,实现“短序列 + 高维特征”。
- SSC 将 多尺度卷积 与 样条卷积 + RBF 非线性映射 结合:
-
输入与整体运算:
- 输入张量:
- $X^{SSC}_j \in \mathbb{R}^{b \times C^{SSC}_j \times L^{SSC}_j}$
- SSC 整体形式:
$SSC(X^{SSC}_j) = BN\bigl(\mathrm{proj}(F_1, F_2, \dots, F_j)\bigr)$
其中 $F_j$ 是第 $j$ 个卷积子模块输出。
- 输入张量:
-
子模块结构(base + spline):
- 融合方式:
$F_j = F^{base}_j + F^{spline}_j$ - base 分支(普通卷积 + SiLU 激活):
$F^{base}_j = \mathrm{SiLU}\bigl(W^{base}_j * X^{SSC}_j + b^{base}_j\bigr)$ - spline 分支(LayerNorm + RBF + 卷积):
$\hat{X}^{SSC}_j = \mathrm{LayerNorm}(X^{SSC}_j)$
$\phi(\hat{X}^{SSC}_j) = \exp\left(-\frac{|\hat{X}^{SSC}_j - R|^2}{2\tau^2}\right)$
$F^{spline}_j = W^{spline}_j * \phi(\hat{X}^{SSC}_j) + b^{spline}_j$ - 参数说明:
- $W^{base}_j, W^{spline}_j$ 为卷积权重,$b^{base}_j, b^{spline}_j$ 为偏置。
- $R$ 为 RBF 中心,$\tau$ 控制高斯核的宽度。
- 融合方式:
2.3 Conv-SSM Encoder
- 模块协同:
- SSC:多尺度 + RBF 非线性,压缩序列、升维特征。
- FSC:轻量多核卷积,进一步分离与强化不同频段特征。
- SSM:在高维时序空间中建模长程依赖,并通过 SelectiveSSM 实现对关键地震事件的自适应关注。
- 三者组成的 Conv-SSM Encoder,为后续多任务 Forecast 层提供统一且信息丰富的时序特征表征。
#3 Experiments
3.1 实验数据集与标签设计
-
数据集构成:
- 使用两个中国大规模地震数据集:
- DiTing:约 2.50×10^6 条三分量波形(CSN,2013.01–2020.12)。
- DiTing 2.0:额外约 0.76×10^6 条波形(2020.03–2023.02)。
- 两者均含专家标注的 P/S 到时、震中距与震级。
- 使用两个中国大规模地震数据集:
-
波形与物理参数分布:
- 每条记录长度为 180 s,采样率为 50 Hz(约 9000 采样点 × 3 分量)。
- 震级范围:0–7.7,震中距最大约 660 km。
- 通过台站空间分布与震级/距离直方图展示数据的广泛覆盖与多样性。
-
检测与拾取标签设计:
- 地震检测标签:
- 时间序列逐采样二值标注,1 表示“有震”,0 表示“无震”。
- 事件起始:P 波初至时刻 $T_P$。
- 事件结束:
$T_{\text{end}} = T_P + \lambda (T_S - T_P),\ \lambda = 2$ - 即以 P–S 时间差为尺度构造检测窗口,覆盖 P、S 及部分尾波。
- 相位拾取标签:
- P 波与 S 波的到时采样点记为标签峰值(1)。
- 周围采样点按高斯分布平滑衰减至 0,标签总宽度为 0.5 s(约 25 个采样点)。
- 相当于构造“概率型软标签”,降低对单点精准对齐的过拟合。
- 地震检测标签:
3.2 Evaluation 指标
-
分类任务(事件检测 / 相位拾取):
- 使用指标:
- 精确率 $ \mathrm{Pr} = \dfrac{T_p}{F_p + T_p} $
- 召回率 $ \mathrm{Re} = \dfrac{T_p}{F_n + T_p} $
- F1 分数 $F1 = \dfrac{2 \times \mathrm{Pr} \times \mathrm{Re}}{\mathrm{Pr} + \mathrm{Re}}$
- 含义:
- $T_p$:真正例数,$F_p$:假正例数,$F_n$:假负例数。
- 精确率:模型预测为“有震”中真正有震的比例。
- 召回率:真实“有震”样本中被模型检出的比例。
- F1:在误报与漏报之间的综合权衡指标。
- 使用指标:
-
回归任务(震级估计 / 到时误差统计等):
- 平均误差(Mean):
$\mathrm{Mean} = \frac{1}{N} \sum_{i=1}^{N} (y_i - \hat{y}_i)$- 反映预测整体偏高或偏低的“系统性偏差”。
- 误差标准差(未显式给出公式)体现误差的波动程度。
- 均方根误差(RMSE):
- 平均绝对误差(MAE):
- 决定系数($ R^2 $):
$R^2 = 1 - \frac{\sum_{i=1}^{N} (y_i - \hat{y}i)^2}{\sum{i=1}^{N} (y_i - \bar{y})^2}, \quad\bar{y} = \frac{1}{N} \sum_{i=1}^{N} y_i$- 衡量模型对数据方差的解释程度,$R^2 \to 1$ 表示拟合很好。
- 在震级回归等任务中,常与 RMSE / MAE 一起使用判断回归性能。
- 平均误差(Mean):
-
整体评价体系:
- 对分类任务,用 Pr / Re / F1 综合衡量“检出能力”和“误报情况”,特别关注召回率以减少漏震。
- 对回归任务,用 Mean + 标准差判断是否存在系统偏差与稳定性问题,用 RMSE / MAE 衡量误差水平,用 $R^2$ 判断整体拟合优度。
3.3 Training details
-
优化器与学习率策略:
- 采用 Adam 优化器(Kingma, 2014),以提高在大规模、多任务地震数据上的训练稳定性与收敛速度。
- 使用 CyclicLR 学习率调度(Smith, 2017):
- 学习率在区间 $[1 \times 10^{-4},\ 1 \times 10^{-3}]$ 内周期性循环:
- 从最小值 $1 \times 10^{-4}$ 逐步升至最大值 $1 \times 10^{-3}$ , - 再降回最小值。
- 学习率在区间 $[1 \times 10^{-4},\ 1 \times 10^{-3}]$ 内周期性循环:
-
公平性与模型选择: - 所有对比模型(包括 EffiSeisM 与基线)使用相同的训练超参数: - 相同优化器与学习率策略 - 相同训练 epoch 数。
- 在训练过程中,以验证集表现最优的 checkpoint 作为最终模型,用于测试集评估: - 相当于基于验证集的模型选择/早停策略。
3.4.1 Comparison with other methods 小结
-
实验与对比模型设置:
- 在三个关键任务上系统评估 EffiSeisM:
- 地震检测
- 相位拾取(P/S)
- 震级估计
- 对比基线包括:
- MagNet
- EQTransformer
- PhaseNet
- SeisT 系列(SeisT-S / M / L)
- 保障公平性:
- 统一训练/验证/测试划分(事件级划分)
- 相同训练策略与超参数(优化器、学习率调度等)
- 测试阶段仅做振幅归一化,不额外“美化”数据
- 在三个关键任务上系统评估 EffiSeisM:
-
训练效率
-
震级估计结果
-
DiTing 上的检测与 P/S 拾取
- P 波拾取(Phase-P):
- 相比轻量 SeisT-S,EffiSeisM 在 $Pr$/$Re$/$F1$ 上分别提升约 3.1%、4.2%、3.7%。
- 相比大模型 SeisT-L,各指标平均提升约 2%,并具有最小平均到时误差。
- 说明在同等或更低计算代价下,P 到时预测更准、更稳。
- S 波拾取(Phase-S):
- EffiSeisM 精确率约 90.52%,F1 约 84.16,均为所有模型中最高。
- SeisT-L 召回率略高(约 79.50%),但 F1 低于 EffiSeisM,说明其以牺牲精确率换取了部分召回。
- EffiSeisM 在保持较高召回的同时,整体精确率与 F1 更优,更适合需要平衡误报/漏报的实际应用。
- P 波拾取(Phase-P):
-
DiTing 2.0 上的泛化与鲁棒性
- 数据量只有 DiTing 的约三分之一:
- 在这种少数据设定下,大容量模型(EQTransformer、SeisT-L)在部分指标上略优于 EffiSeisM。
- 表明在模式更简单、数据更少时,大模型仍能稳定拟合有限模式。
- 数据量只有 DiTing 的约三分之一:
3.4.2 Efficiency evaluation
-
评估目标:
- 验证 EffiSeisM 通过轻量化与高效架构设计在 训练效率、参数规模与精度 三方面的综合提升。
- 既看训练与参数效率,也看推理效率和在不同计算负载下的可扩展性。
-
训练效率与参数量(基于 DiTing 2.0,图 3):
- 对比维度:$R^2$(震级估计精度)、单次训练时间、模型内存占用(参数规模)。
- EffiSeisM:
- $R^2 \approx 0.92$
- 训练时间 ≈ 4.92 s
- 参数规模 ≈ 488 KB
- SeisT-M / SeisT-L:
- $R^2$ 与 EffiSeisM 接近,但:
- 训练时间分别约 7.23 s 与 8.71 s
- 参数规模分别约 1244 KB 与 2100 KB
- MagNet:
- 参数略少(约 446 KB),但:
- 训练时间 ≈ 13.7 s(远高于 EffiSeisM)
- $R^2 \approx 0.87$(明显低于 EffiSeisM)
- 结论:
- EffiSeisM 在 “精度–速度–参数量” 三维度上整体最优,
- 真正实现了高精度与资源效率之间的最佳折中。
-
推理效率评估设计:
- 与多任务基线模型 SeisT(含 S/M/L 变体)比较。
- 两组实验:
-
实验一:固定样本数、改变 batch size(图 4(a)):
- 输入样本数:10,000。
- 随着 batch size 增大,EffiSeisM 始终保持较低推理时间。
- 例如:
- batch size = 50 时:
- EffiSeisM:≈ 3.5 s
- SeisT-L:≈ 5.9 s
- 时间缩短约 40%。
- batch size = 50 时:
- 在小 batch 下,EffiSeisM 优势更明显:
- 特别适合资源有限、需要实时响应的场景(如在线预警、边缘计算)。
-
实验二:固定 batch size、改变样本数(图 4(b)):
- 随着输入样本数增加,所有模型推理时间均随之增长(符合预期)。
- EffiSeisM 在所有输入规模下均优于各 SeisT 变体:
- 当输入规模为 100k 时:
- EffiSeisM:≈ 33.9 s
- SeisT-S:≈ 36.5 s
- SeisT-M:≈ 47.6 s
- SeisT-L:≈ 64.6 s
- 相比 SeisT-L 时间缩短接近 48%。
- 当输入规模为 10k 时:
- EffiSeisM:≈ 5.01 s
- SeisT-L:≈ 8.35 s
- 时间缩短约 40%。
- 当输入规模为 100k 时:
3.4.3 模块贡献
- 模块消融实验(Detection / P-phase / S-phase):
- 对检测、P 相和 S 相拾取任务进行消融(见表 6),比较不同模块组合下的 Pr / Re / F1。
- 结果表明:
- 去掉任一关键模块(SSC / FSC / SSM)都会导致性能下降,去除 SSM 层退化最严重。
- 完整 EffiSeisM 在三个任务上 F1 分数分别约为 96.05%、91.42%、84.01%,优于所有消融变体。
- 优化与收敛分析:
- 单独使用 SSM 层时,训练收敛明显变慢(图 5)。
- 引入 FSC 层后,训练速度与稳定性显著提升:
- FSC 层通过多尺度卷积精炼特征,使输入特征更适合 SSM 建模;
- 有助于调节梯度流、降低过拟合、加速收敛。
- 总体结论:
- SSC 模块(多尺度 + RBF)、FSC 层(快速多尺度卷积)与 SSM 层(时序依赖建模)在结构与优化层面都对性能有重要贡献。
- 消融结果验证了这些设计选择的必要性和合理性,同时展示了 EffiSeisM 框架在多任务地震监测中的鲁棒性与通用性。
-
整体贡献与适用场景:
- 提出高效多任务模型 EffiSeisM,将卷积架构与状态空间建模相结合。
- 在包含约 300 万条波形的 DiTing 与 DiTing 2.0 上验证,覆盖地震检测、相位拾取和震级估计三大任务。
- 模型结构紧凑(约 488 KB),在不牺牲精度的前提下实现高效训练与推理,适合资源受限环境下的地震监测和预警部署。
-
震级估计误差分布:
- 使用误差分布(预测震级与真实震级之差)分析各模型性能:
- EffiSeisM 的误差分布尖锐、集中且近似对称围绕 0,说明系统偏差小,$RMSE$ 和 $MAE$ 较低。
- SeisT 各变体误差分布更宽,MagNet 最分散,对应更大的误差和更低的 $R^2$。
- 使用误差分布(预测震级与真实震级之差)分析各模型性能:
-
严格阈值下的相位拾取鲁棒性:
- 在 DiTing 上将相位拾取容差阈值从 0.5 s 收紧至 0.2 s:
- 所有模型的 P/S 拾取 F1 分数均下降约 10%,反映出高时间分辨率拾取的难度。
- 在 0.2 s 严格阈值下:
- P 相拾取:EffiSeisM 相较 EQTransformer 和 SeisT-L 提升约 5%,较 SeisT-S 提升约 6.3%。
- S 相拾取:EffiSeisM 与 SeisT-M/L 表现相近,但明显优于 EQTransformer(约 7.4%)和 SeisT-S(约 2%)。
- 在 DiTing 上将相位拾取容差阈值从 0.5 s 收紧至 0.2 s:
-
真实连续波形上的泛化验证(Fig. 8):
- 在 LSA 台站一段真实三分量宽频带连续波形(2025-02-11 17:10:30–17:15:00 UTC)上比较各模型表现:
- PhaseNet:对噪声极为敏感,容易产生错误相位识别。
- EQTransformer 与 SeisT-S:能够检测地震并较准确拾取 P 相,但对相对较弱的 S 相到时识别较差。
- SeisT-M / SeisT-L:整体性能相近,SeisT-L 检测曲线更稳定,两者 P 相拾取准确,但在弱 S 相到时上仍然存在困难。
- EffiSeisM:在检测与 P 拾取上表现优秀,并在捕捉微弱 S 相到时方面明显优于其他模型。
- 结论:
- EffiSeisM 能够从原始连续宽频带波形中提取更深层次的时序特征,
- 在实际噪声环境和复杂波形条件下保持鲁棒性和高精度,体现出较高的工程应用潜力。
- 在 LSA 台站一段真实三分量宽频带连续波形(2025-02-11 17:10:30–17:15:00 UTC)上比较各模型表现:
- 综合讨论
5. Conclusion
-
核心工作概括:
- 提出 EffiSeisM:一种将卷积架构与状态空间建模(SSM)相结合的高效多任务模型。
- 支持三大任务:
- 地震检测
- 相位拾取(P/S)
- 震级估计
- 在 DiTing 与 DiTing 2.0 共约 300 万条样本上进行系统训练与评估。
-
性能与效率优势:
- 紧凑架构(参数量大幅减少),在保证高精度的同时显著降低计算开销:
- 训练更快、推理更快,适合大规模地震监测与批量数据处理。
- 多任务统一框架减少冗余计算与模型维护成本:
- 一次前向即可输出检测 + 拾取 + 震级结果。
- 提升整体系统的通用性与鲁棒性。
- 紧凑架构(参数量大幅减少),在保证高精度的同时显著降低计算开销:
-
状态空间模型带来的改进:
- SSM 的引入增强了对长时间依赖与时序结构的建模能力:
- 提高不同震级、震源距和噪声条件下的精度与可靠性。
- 在优化资源使用的前提下保持性能一致性:
- 兼顾内存占用、计算复杂度与实际运行成本。
- SSM 的引入增强了对长时间依赖与时序结构的建模能力: