Abstract
- 本文回顾了机器学习在地震学中的应用,尤其是在地震目录构建、地震活动性分析、地面运动预测和地壳变形分析等领域的进展。
- 地震目录构建涉及事件检测、分类、到时拾取等核心过程;
- 地震风险评估和活动性分析是理解地震发生规律和评估潜在风险的重要环节;
- 地面运动预测被细分为四类,根据输出类型和输入数据的不同进行分类;
- 数据不平衡则是另一个挑战,解决方法涉及特定的技术和策略;
- 地壳变形分析聚焦于利用测地数据进行聚类分析和信号检测,帮助识别地震和非地震现象。
引言
- 机器学习技术,尤其是深度学习,在地震学等科学领域取得了显著进展。
- 本文重点回顾了机器学习在地震目录构建、地震活动性分析、地面运动预测和地壳变形分析中的应用。
- 文章的重点是探索机器学习在独立领域的应用,而非对整个领域进行全面回顾。
- 地震目录编制 领域是推动机器学习在地震学应用的关键之一,涉及地震波形检测、震中定位和目录编制技术。
改进地震目录
- 地震目录编制 领域中,改善事件检测能力能够显著增加可分析的事件数量,并提升地震活动性分析的时空分辨率。这一进步有助于我们更深入地了解地震的生成过程,特别是小型地震在这一过程中扮演的角色。
- 模板匹配技术 和 深度学习 是提升地震目录完整性的重要手段,尤其是在处理低信噪比的小型地震事件时,能够显著降低完整性大小并提高事件检测的效率。尽管计算成本较高,GPU并行计算使得这些技术能够应用于更大规模的数据集。
- 机器学习技术 在高质量地震目录开发中的应用自2018年以来迅速发展,特别是深度学习(DL)在事件检测和到时拾取中的应用,为地震目录的构建提供了更高的自动化和准确性,远超传统方法。
- 迁移学习和微调 技术的应用使得机器学习能够应对数据稀缺的挑战,尤其是当目标地震的规模或观测频带与训练数据存在显著差异时,仍能有效应用。这种技术也大大降低了大规模训练数据准备的需求。
- 许多基于机器学习的工具包已发布并广泛应用于从事件检测、到时拾取、相位关联到震中定位的完整目录编制流程,推动了地震目录编制的自动化和精确度的提升。
- 地震目录编制流程 通常包括事件检测、到时拾取、相位关联和震中定位等步骤,机器学习技术已在这些步骤中得到应用,显著提高了性能。
- 去噪和质量控制 阶段的加入可以进一步提升目录编制的质量,优化检测结果。
- 机器学习技术 显著优于传统方法,尤其在事件检测和到时拾取等任务中表现突出,许多经过训练的机器学习模型已公开,并适用于这些任务。
事件检测/到时拾取
-
流程简化:跳过事件检测阶段
- 直接在连续波形上进行到时拾取,简化流程但需控制误检率与相位关联效率;
- 工程案例:Park 等人(2020)和 Heck 等人(2022)已采用该方法于连续数据集进行高精度拾取,显著提高计算效率与整体处理速度。
-
监督深度学习相位拾取器
- 使用神经网络模型进行到时读取,准确度已接近人工分析员,尤其在 S 波拾取上优于传统方法;
- 示例:PhaseNet 模型读取北加州百万级地震记录,P/S 波拾取精度接近或优于人类分析员
-
多样化深度学习模型架构
- 集成 RNN、Attention、Transformer、Edge Conv 等模块不断提升性能;
- 案例:Earthquake Transformer 一体化处理事件检测与拾取,效率与准确性均优于传统与早期 DL 方法 。
-
灵活输入/输出形式
- 支持单站、多站输入,输出可为标量或概率时间序列,可适应不同事件时长;
- 如:Ocean-Bottom Seismometer(OBS)专用 PickBlue 模型使用了多通道与迁移学习,P/S 波平均拾取误差如下:MAD=0.05 s 和 0.12 s。
-
多任务学习模型
- 将事件检测与相位拾取整合于单一模型,增强一致性与效率;
- 示例:EQTransformer 同时输出事件概率与 P/S 波到时,支持端到端训练。
-
数据增强缓解大地震样本稀缺
- 利用 GAN、波形相似性训练合成数据提升模型泛化;
- 示例:SeismoGen(Wang et al. 2021)用 GAN 合成了多标签地震波形用于 Oklahoma 数据增强,显著提升检测准确性 。
-
生成对抗网络(GAN)辅助特征提取
- GAN 不仅生成训练样本,还用于特征提取与去噪;
- 应用:Li 等(2020b)通过 GAN 合成训练数据用于地震事件检测,并在特征提取中提升效果
震相关联
- 误报剔除与残差优化:通过迭代剔除大残差候选,可提升震中定位精度。
- 网格搜索关联 + 理论到时匹配:传统而稳定,REAL 工具包高效运用此方法构建高质量地震目录 。
- 神经网络替代网格搜索:Yu & Wang(2022)使用 NN 高速关联,提高处理效率。
- RNN、图神经网络(GENIE)、贝叶斯高斯混合模型(GaMMA)、PINNs:多种先进模型用于增强关联准确性与物理一致性。
- 波形对二分类 & 深度度量学习:以波形特征直接判断是否属于同一事件,减少对到时模型依赖。
地震定位
- 到时反演方法(Geiger 1912 用传统或 ML 算法如随机森林/FCNN),适用于 EEW 快速定位。
- 波形叠加定位(端到端 DL),跳过拾取过程,适合探测小震但计算成本高。
- 图像回归 / 强化学习定位:使用相干/迁移图(diffraction stack 图)或深度强化学习实现定位创新。
- 单站定位算法:应用 SVM、DL(ConvNetQuake 等),实现无需多站波形即可定位。
- 多站全波形 DL 模型与图神经网络:融合多站数据最大化信息利用,提升准确性。
- 贝叶斯方法与合成数据训练(GAN 等)助力数据稀缺情况下定位;PINNs 增强物理一致性与未知事件泛化能力。
质量控制
- 传统阈值质量控制(如到时残差限值)容易导致误报与漏报,难以兼顾精度与覆盖度。
- 机器学习非线性分类:通过模型自动筛选震中结果,提升质量控制效率与准确性。
- 集成学习(Tamaribuchi et al. 2021, 2023):结合日本气象厅自动目录,实现大规模自动化系统对震中误报的剔除。
- CNN 模型质量筛选:利用 Ross et al. (2018) 的 CNN 对自动拾取的相位进行过滤,减少误报。
- ML 应用于其他检测流程:如从能量检测结果(Beaucé et al. 2019)和匹配滤波候选(Herrmann et al. 2019)中剔除错误事件。
相似波形搜索
- 相似波形搜索(如模板匹配与自相关)能发现被噪声掩盖的小震,但计算复杂度高。
- ML与无监督方法,如 Skoumal 的重复式信号检测与 Ganter 的 ML 模板生成,可减少预先模板需求和计算成本。
- LSH + FAST 方法基于频谱指纹与近似邻域搜索,实现快速波形检索,比自相关快 100 倍,已用于多站长时序数据
- 大规模部署:优化后的 FAST 支持 11 站、6–11 年数据集处理,成功发现新地震事件(如 Diablo Canyon 与新西兰)
- 深度哈希技术:Naoi&Hirano将波形转为64位二进制码,用于16通道高采样 AE 数据,显著提高效率
震源机制分析
- 二分类读取 P 波初动极性:深度学习如 DiTingMotion、RPNet 等可实现高精度自动判断,适用于大规模机制构建 :contentReference[oaicite:23]{index=23}。
- 单站/多站输入设计灵活,DL 方法适配不同数据采集场景(Uchide、Cheng、Tanaka 等)。
- 无监督极性识别:DL 聚类实现从波形中自动识别初动方向,无需标签数据。
- 极性补全增强机制库:ML 补全低信噪站点极性显著增加机制数量与定位精度(Skoumal 等)。
- 快速机制估算与物理约束模型:EEW 应用中尝试实时机制估算;Physics‑Guided NN 和 PINNs 通过嵌入物理规律提升未知事件泛化能力。
古地震记录分析
- 数字记录 vs 模拟记录:目前只有自地震仪全面数字化以来的近四分之一时期拥有数字波形,其余需依赖模拟数据(如烟熏纸、Develocorder 胶片)。
- CNN 自动数字化烟熏纸记录:Furumura 等(2023)使用 CNN 模型成功将烟熏纸上记录的强震波形进行数字化,验证与人工数据高度一致。
- DevelNet 处理 Develocorder 胶片:Wang 等(2019b、2022d)开发 DevelNet 系统,从两年连续胶片中提取事件信息(检测、到时、震级、震中),并成功重建历史地震目录,事件数量为原目录的两倍。
- DL 识别低频地震事件:Kaneko 等(2021、2023)使用深度学习模型在模拟记录中检出历史低频地震,拓展了地震种类研究。
当前成就与未来展望
- 深度学习显著提升目录开发精度:自动处理性能晋升至接近人工水平,覆盖从检测、拾取到极性读取等任务。
- 多站点一致性与架构优化是未来重点:下一步目标是改进模型架构实现更强多站一致性与综合鲁棒性。
- 相位关联、定位与质量控制仍需研究投入:当前仍处于 ML 应用初步阶段,需进一步实证与工程化探索。
- 端到端自动化是趋势方向:如 LOC‑FLOW、PhaseNet+ 等一体化框架提供流程整合、精度提升与效率优化。
- 再训练与共享基础设施关键:推荐使用 SeisBench 等框架标准,公开数据集和再训练模型以加速研究发展。
地震风险评估与地震活动性分析的应用
实验室地震破裂预测
- 随机森林预测实验滑动:Rouet-Leduc 等(2017)用 AE 窗口特征成功预测破裂时间(R²≈0.9),提前量大于整个周期 。
- 竞赛推动算法发展:Kaggle 比赛激发多个新模型(如深度学习、自监督聚类、注意力机制) 。
- 关键预测特征发现:如 AE 波形振幅方差、事件持续时间,可预测滑动模式及破裂时间 。
- 目录级预测方法:Lubbers(2018)指出即使仅使用 AE 目录信息,若目录完整仍可有效预测。
- 物理约束与 PINN 方法:Borate(2023)等通过 PINNs 在样本不足时稳定预测 。
- 多实验场景扩展:推挤实验:预测滑动是否发生与时机(Corbi、Mastella 等);微滑制度成像与位移评估(Trugman、Ma、Chaipornkaew 等)。
诱发地震风险评估
- 微震目录与机制编目自动化:ML 显著提升微震和机制目录质量,为诱发地震研究提供高质量输入数据。
- 关键因素解释分析:逻辑回归与树模型有效识别控制诱发机制,如孔隙压力率和注入深度。
- 地震率与预警模型:随机森林、增强回归树、神经网络(RNN、CNN、Transformer)可实时预测地震率与潜在大事件前兆,可用于风险控制。
- 变压力区有效率较高:Oklahoma 包注水案例中识别孔隙压力率为关键,并成功预测长期趋势。
- 地热场领先预警案例:Geysers 和 Hengill 地热场的 RNN 与 Transformer 模型已具实用性,可部分预测 M~4 事件。
地震活动性分析中的其他应用
- 无监督聚类技术(DBSCAN、HDBSCAN、OPTICS、GMM、SOM)广泛用于识别地震簇、断层结构、余震序列和构造颤动。
- 背景活动剥离( declustering):Aden‑Antoniów 等(2022)使用随机森林将背景与触发地震区分,性能好于基于 spatiotemporal 阈值的传统方法 。
- 背景率建模改进:Trampert 等采用梯度树分布成分模型;Muir & Ross 用深高斯过程替代 ETAS 中简化背景率 。
- 非线性后震空间模型:如 RECAST 模型为替代 ETAS 的时空点过程模型。
- 结构性 asperity 识别:监督学习识别板块边界 asperity,为震活性解释提供新工具。
地面运动预测中的应用
从特征预测地面运动强度
- 模型替代与提升:ML 增强型 GMPE
- ML 替代/增强 GMPE:从早期的神经网络、支持向量回归、高斯过程,到现代的随机森林、XGBoost 等树模型,预测 PGA/PGV/反应谱等强度指标的精度已超越传统经验回归模型(如 Khosravikia & Clayton 2021)。
新特征加入
- 结合空间与站点信息:纳入震中经纬度、后方位角(back azimuth)、HVSR 以及站点 ID(one-hot 编码)等变量,有效降低预测误差(Log σ),增强站点放大模拟能力(Oana 2022;Esteghamati 2022;Okazaki 2021)。
- 空间化预测:Lilienkamp 2022 采用地图式数据预测区域地震动;Rekoske 2023 基于降阶 POD 重现 PGA 空间分布。
- 贝叶斯神经网络 (BNN):Sreenath & Raghukanth 2023 利用 BNN 提供置信区间,使预测结果更有可信度。
- 引入 XAI 技术:Mohammadi 2023 应用 SHAP(Shapley additive explanations)来评估 XGBoost 模型中各特征的贡献度,提升模型透明性。
根据特征预测地面运动时间序列
生成式 ML 模型推动时间序列预测
- Florez et al. (2022):首次提出 CGAN 生成真实感三分量地震记录(conditioning on M, R, Vs30);其结果与真实地震记录在时间–频率上高度一致。
- Esfahani et al. (2023):使用 TF-cGAN 结合时频谱和相位检索,生成非平稳地震波形 。
- Matsumoto et al. & 扩散模型:生成概率地震时间序列,保留丰富频谱特征,未来采用扩散模型是趋势方向 。
物理推动的算法提升
- PINNs 方法:在频域/时域正向波传播中嵌入 PDE,效果优于传统 чис值模拟,但对高频和复杂介质面临挑战 。
- Neural Operators 如 FNO、GNO:实现对声波/弹性波传播的高精度代理,速度提升近两位数,并验证稳定性与泛化性能。
从时间序列预测地面影响强度
- EEW 强度快速估计:只需 5–10 s 初期波形,CNN、GNN、RF 等模型即可在数秒内完成目标站点 PGA 等强度预测(Jozinović et al. 2020;Bloemheuvel et al. 2022;SC‑GNN 2023)。
- 多站点输入架构提升精度:TISER‑GCN 模型结合空间信息与迁移学习,MSE 优于单站 CNN 模型 约 16%。
- 自监督 + GNN 架构优化:SC‑GNN 利用对比学习构建地震嵌入,短输入窗(5 s)即可稳定预测,适应性强、更适合 EEW 实战 。
- 多样化模型探索:RF、SVM、LSTM 等也被广泛实验,对比显示 GNN 架构在利用空间关联性
从时间序列预测地面运动序列
- 高效时空预测模型:LSTM、CNN‑Voronoi、时空 RNN 和 GPR 等方法通过当前波形实现目标站点未来/当前地面运动预测,提高 EEW 与智能灾害应急响应能力。
- 物理—数据融合策略:通过 ML 映射 PBS 模拟信息,生成现实感强、覆盖全频带的波形,辅助工程设计与分析。
- 波形质量提升作用凸显:去噪处理是构建高质量输入的基础,决定预测系统的底层表现。
与地面运动预测相关的研究
- 数据驱动站点响应模型:DL 模型已较好替代 1D 理论模型,实现站点放大函数的更高精准预测。
- 单站估计放大响应:SeismAmp 等算法可识别地震记录中的站点响应组件,有助于现场即时校正。
- 记录质量自动评估:DL 模型评估记录频带质量,提高后续模型训练数据集质量。
- 模拟样本扩充助力危险性评估:Imai 等利用 POD 和 copula 技术生成多种情景摇晃图,为危险性分析增量数据。
- 多灾种技术迁移发展:相同 ML 框架已在地震动与海啸预测中推广应用,支持多领域综合预警体系。
平衡地震运动数据不平衡问题的方法
- 利用合成数据补充稀缺区域:通过 PBS 或生成模型补足高震级/强震样本,增强 ML 模型泛化。
- 物理模型融合 ML 方法:Hybrid ML‑GMPE 和物理先验网络提高模型对强地震事件的敏感度和稳定性。
- 添加数学先验关系:如单调性约束,有助模型更好遵循地球物理规律,减少偏差。
- 跨区域模型迁移:用数据丰富区域的预训练模型适配数据稀少区域,有效缓解偏差问题。
地面运动预测的现状与未来展望
当前进展
- 精度优于传统模型:ML 模型普遍表现超过经典 GMPE,但实用应用仍有限。
- 强震、近震数据不足:高强地面运动观测稀缺,严重影响训练稳健性。
- 网络与数据库强化:NGA‑West2、NZSM 数据集深化应用并补全数据偏向。
在大地测量数据上的应用
聚类
-
聚类种类
- 硬聚类(Hard Clustering):层次聚类、K-means、Euler-vector → 站点归属唯一;
- 软聚类(Soft Clustering):GMM、模糊 C-means → 每站表达隶属概率,揭示边界不确定性。
-
应用案例
- Simpson 等(2012):旧金山湾区速率聚类;
- Savage & Simpson(2013):加州/大地区Euler-vector聚类;
- Savage & Wells(2015):通过北美西北板块结构验证聚类;后续拓展至台、土耳其、新西兰等。
-
噪声评估机制
- Takahashi 等(2019):引入信息熵+蒙特卡洛方法评价分区稳定性。
-
扩展数据变量
- Yáñez-Cuadra 等(2023):使用应变率/旋转率改进聚类效果。
-
工具开发
- Granat 等(2021):创建开源代码,支持快速部署 GNSS 聚类与可视分析。
模型与预测地壳变形:AI 应用
-
粘弹性模拟加速
- DeVries et al. (2017):神经网络学习理论粘弹性结果,加速可达 50,000 倍 。
-
PINN 静态变形建模
- Okazaki et al. (2022):使用极坐标结合 PINN 模拟地震造成的静变形,模拟断层位移不连续边界。
- Fukushima et al. (2023):利用 PINN 模拟慢滑事件的滑速演化,并以此反演摩擦参数 。
-
时序预测
- Fukushima et al. (2023):将 PINN 应用于俯冲界面滑动速率短期预测 。
-
震后形变预测
- Yamaga & Mitsui (2019):RNN 处理 GNSS 时间序列,预测震后变形效果优于传统模型,残差可揭示主导机制。
结论
研究成果
- 广泛应用:ML 在地震目录构建、活动分析、地面运动预测与大地测量数据分析上取得重要进展。
- 数据不平衡问题突出:强震与高强度地震数据稀缺,需通过数据增强、领域知识融合、迁移学习等方法补偿。
- 黑盒问题正被攻克:利用 PINNs、神经算子、BNN 与 XAI 等技术提升模型可解释性与物理一致性。
未来展望
- 深度整合 领域物理知识 与 ML 模型,提高泛化能力;
- 在更多任务中推广 生成式增强、迁移学习、监督与半监督学习;
- 推进 可解释、可重复的 ML 基准框架,增强工程应用信任;
- 拓展 ML 应用于 全周期地震过程模拟与预测,深化地震物理机制理解。
转载请注明出处