[Literature Reading]Using Convolutional Neural Network to Determine Time Window for Analyzing Local Shear-Wave Splitting Measurements

Abstract

研究利用CNN来确定时间窗口的结束位置(e)，并且设定时间窗口从e前0.5秒开始。
使用了803个人工标记的数据点，这些数据记录了来自三个地震站点的前震和余震信号。为了提高模型的鲁棒性，每个测量数据进行了21次位移操作(数据增强)
与MFAST方法的对比[绝对误差和标准差(时间窗口结束时间（e）、剪切波分裂时间和快速波偏振方向)、一致性(空间分布)]
泛化能力与应用(其他台站记录)

Introduction

剪切波分裂与地震各向异性（分裂参数量化地震波的各向异性）
地震各向异性的成因（应力诱导、结构诱导）
数据量增加与人工验证挑战
人工验证的优势与不可替代性

CNN在远震SWS分析中的应用 #
时间窗口的选择对局部SWS测量的重要性

SWS测量中的时间窗口选择： localSWS测量，时间窗口的选取极为关键，特别是在S相的时间窗口较窄的情况下。
    准确的时间窗口能有效捕捉剪切波分裂的信号，否则会影响后续计算剪切波分裂参数（如快慢波的到达时间差、偏振方向等）的精度。
传统方法的局限性： 在传统的SWS分析方法中，如最小能量法（Silver和Chan，1991；Liu和Gao，2013），时间窗口必须精准选定，否则结果不可靠。
    手动确定时间窗口的过程费时且容易受到人为误差的影响，随着地震台站数量的增加和数据量的急剧上升，手动验证变得越来越困难。

研究重点放在确定时间窗口的结束时间（e）上，主要因为结束时间的容错范围较窄，因此需要精确控制。相比之下，开始时间的容忍范围较宽，因此可以设定为结束时间前0.5秒。

方法与相位挑选CNN方法（Zhu和Beroza，2019 ）有相似之处 #

Data and Methods

1. 数据集构建与预处理

数据来源：三个地震台站，涵盖了该地区发生的多次地震事件，提供了丰富的剪切波分裂数据。震级从微震到中等规模的地震都有，确保了测量数据的广泛性和代表性。
时间窗口划分：以理论S波到达时间为中心的4秒时间窗口来分割三分量地震记录，采样率为0.01秒。
带通滤波： 每个地震信号在预处理过程中都经过了0.5–10 Hz的带通滤波，滤去了噪声和不相关的高低频成分。

2. 数据增强与扩展

在每个测量值上随机位移20次，位移范围为±0.2秒，从而生成了16,863个测量值。

3. 高斯掩膜技术

由于结束时间（e）具有一定的变动范围，研究采用了高斯分布作为掩膜来定义e的可能范围（类似phasenet）
根据人工标注的e值中心，定义一个以e为中心的概率范围，从而识别出合理的结束时间区间。

4. 数据集的划分与交叉验证

shuffle，[9,1]
交叉验证，确保模型在不同数据子集上的表现一致，从而减少过拟合的风险。

模型部分
12层U形卷积神经网络（CNN）结构，用于自动预测局部剪切波分裂（SWS）测量中时间窗口的结束时间 e

输入与输出： 模型输入为三分量地震波数据（Z、N、E），输出为每个数据点是结束时间 𝑒的概率。
网络结构： 采用U形结构，其中卷积层（Conv-1D）提取和压缩数据特征，反卷积层（Deconv-1D）扩展数据形状以适应输出。
激活函数： 隐藏层使用LeakyReLU，避免神经元死亡；输出层采用Sigmoid函数，提供概率输出。
二元交叉熵损失： 将时间窗口预测建模为二分类问题，通过交叉熵损失函数评估预测准确性。
Adam优化器： 通过学习率0.001和10次迭代优化网络，平衡训练速度与收敛效果。

Results

剪切波分裂参数计算
#20 #

最小特征值法 
基于优化后的剪切波偏振方向，重新计算波的径向和横向分量（以优化得到的快波偏振方向φ作为参考方向），确保后续分析更加准确。

结果质量评估
高质量特征：使用CNN挑选的时间窗口处理的测量数据展现出与人工标注一致的高质量特征，包括：

明显的S波到达信号： 在水平分量上清晰可见，表明时间窗口捕捉到了关键信号。
横向分量能量的有效消除： 剪切波分裂的横向能量被有效移除，提高了测量结果的物理意义。
粒子运动轨迹校正： 校正前的椭圆运动变为近似线性，进一步验证了校正的准确性。
横向分量最小能量轮廓： 横向分量上显示了明确的最小能量区域，符合理论预期。
与人工方法的对比： 结果显示，CNN选定时间窗口处理的测量值在物理特性和数据质量上与人工挑选时间窗口的结果非常相似。

结果对比与精度分析

CNN在三个关键参数（结束时间 e、快慢波到达时间差δt 和快波偏振方向 ϕ）上的精度几乎与人工标注一致。
平均误差量化为：e： 0.02309秒；
δt： 0.00519秒；
ϕ： 8.54321°。
这些误差范围非常小，进一步验证了CNN方法在自动化测量中的可靠性。

横轴：人工标注的结果；纵轴：（CNN 或 MFAST）的预测结果
空间分布分析
将CNN和人工方法的结果在地图上展示，测量结果在台站位置和事件位置上均表现出高度一致的空间分布趋势。

红绿蓝：三个台站； abc ：人工、CNN、MFAST

Discussion

与非机器学习方法的对比

 MFAST与CNN对比（为实现自动化，MFAST 借助 PhaseNet 检测 S 波到达时间，并结合多频率带通滤波器选择时间窗口。）
CNN:平均误差：𝑒=0.023，δt=0.005 秒，ϕ=8.54°，结果分布集中，与人工标注高度一致。。
MFAST 方法：平均误差：e=0.197秒，δt=0.043秒，ϕ=24.17° ，测量结果分布较为离散，偏离人工标注的趋势。
此外，MFAST 的测量在断层区域表现不佳，显示了算法对复杂信号的处理能力不足。

其他台站数据的应用

局部SWS测量缺乏标注数据集，研究通过BURN台站的数据手动生成高质量参考数据进行对比
NN和人工标注的结果在快慢波时间差 (δt) 和快波偏振方向 (ϕ) 上几乎一致，数值误差仅为：
δt：0.001±0.003 秒。ϕ：约 1° 的偏差。
空间分布：与人工标注高度一致。
CNN结果与先前研究（Liu等，2008）保持一致性，进一步支持其准确性和可靠性。

时间窗口起始时间
时间窗口起始时间的重要性

噪声去除： 通过适当调整起始时间，可以有效去除P波和P尾波的干扰。
信号完整性： 确保完整捕获S相信号，以提供准确的剪切波分裂（SWS）参数。
本研究中，选择e前0.5秒作为起始时间被证明是合理且兼容的，适用于测试数据集中的所有测量。

时间窗口起始时间的可变性（特定情况下，时间窗口的起始时间应根据测量条件进行动态调整。）

浅源近震： 浅源事件中，P波和S相的传播时间间隔较短，需缩短时间窗口起始时间与e的间距，以避免P波干扰。
深源远震： 深源事件中，S相传播时间较长，时间窗口需更早开始，以保证完整捕获S相信号。
数据集中，事件深度范围为3.1至14.4公里，事件与台站之间的距离范围为0.7至14.1公里，最大入射角约为35°。

基于机器学习的自动排序

S相时间窗口的准确性直接决定了剪切波分裂参数（δt 和 ϕ）的可靠性。
如果时间窗口选择不准确，可能导致测量中的横向分量干扰未完全去除，从而影响分裂参数的精度。
横向分量通常包含与各向异性相关的特征信号，但也可能受到其他波（如P波或P尾波）的干扰。

精确的时间窗口可以实现横向分量能量的最小化，这种校正特性为分析剪切波分裂提供了明确的物理依据。
横向分量的能量特性不仅是地震信号分析的关键，也是自动化排序的重要特征。

横向分量校正后的能量最小化特征可作为机器学习模型的核心输入特征，帮助自动化评估测量值的质量。
配合前面的研究

Conclusions

研究开发了一种CNN模型，用于局部SWS测量时间窗口结束时间e的自动选择，并验证了其在剪切波分裂参数测量中的高精度和高效性。
CNN能够显著提高SWS分析的可靠性，为未来完全自动化的剪切波分裂测量与排序系统提供了技术基础。

Paper Link