煤矿冲击地压波速前兆提取学习笔记 · Class 2

从物理机制出发，理解噪声互相关测量 dv/v 的完整链路及前兆提取方法

一、冲击地压的物理本质

1.1 定义与机制

冲击地压（Rock Burst）是煤矿深部开采中一种典型的动力灾害。其根本物理过程可以表述为：高应力作用下，煤岩体内储存的弹性应变能发生突发性、不可控的释放，导致围岩瞬间失稳破坏，并以弹性波（地震波）的形式向四周辐射能量。

完整过程链：

构造应力 / 采掘扰动
  → 围岩应力重分布 → 局部应力集中
  → 微裂隙从随机生长转为定向扩展
  → 裂隙级联、贯通 → 破裂成核
  → 岩体突然失稳破裂
  → 弹性应变能以地震波形式释放 → 冲击地压

1.2 能量视角

从能量角度，冲击地压的本质是弹性应变能 $U_e$ 的积累-释放过程。单位体积的弹性应变能为：

$$ U_e = \frac{1}{2E} \left[ \sigma_1^2 + \sigma_2^2 + \sigma_3^2 - 2\nu(\sigma_1\sigma_2 + \sigma_2\sigma_3 + \sigma_3\sigma_1) \right] $$

其中 $E$ 为弹性模量， $\nu$ 为泊松比， $\sigma_1, \sigma_2, \sigma_3$ 为主应力。

在单轴简化情况下（煤矿回采空间附近近似）：

$$ U_e = \frac{\sigma^2}{2E} $$

以典型煤矿参数估算：若 $\sigma = 30\ \text{MPa}$ ， $E = 5\ \text{GPa}$ ，则 $U_e \approx 90\ \text{kJ/m}^3$ 。一个体积为 $100\ \text{m}^3$ 的破坏区域释放的总应变能约 $9\ \text{MJ}$ ，相当于约 2 kg TNT 当量——足以造成严重的巷道破坏。

1.3 应力积累阶段的关键信号

煤岩体在宏观破坏之前经历了一个复杂的微破裂演化过程，可以分为以下阶段（参考 Brace et al., 1966 和 Scholz, 1968 的实验室岩石力学研究）：

阶段	应力水平（占峰值百分比）	微裂隙行为	可观测信号
裂隙压密	0-20%	原生裂隙闭合	波速略升
弹性变形	20-40%	无明显新裂隙	波速稳定
裂隙稳定扩展	40-70%	翼形裂隙开始生长	波速开始各向异性下降
裂隙加速扩展	70-90%	裂隙级联合并、贯通	波速显著下降，声发射加速
宏观破裂	>90%	裂隙网络整体贯通	波速骤降，大能量事件

核心要点： 微裂隙的演化在宏观破坏之前就已开始，且通过波速变化可以被观测到——这正是波速作为前兆指标的物理基础。

二、应力-裂隙-波速的关系

2.1 弹性波速的基本公式

地震波的传播速度由介质的弹性模量和密度决定。对于各向同性弹性介质：

P 波速度：

$$ V_p = \sqrt{ \frac{K + \frac{4}{3}G}{\rho} } $$

S 波速度：

$$ V_s = \sqrt{ \frac{G}{\rho} } $$

其中：

$K$ ：体积模量（Bulk Modulus），抵抗体积压缩的能力
$G$ ：剪切模量（Shear Modulus），抵抗形状改变的能力
$\rho$ ：介质密度

从公式可以直接推导波速变化的方向性信号：

裂隙张开 → 介质抵抗形变能力降低 → $K \downarrow, G \downarrow$ → $V_p \downarrow, V_s \downarrow$
裂隙闭合 → 介质抵抗形变能力增强 → $K \uparrow, G \uparrow$ → $V_p \uparrow, V_s \uparrow$

$V_p/V_s$ 比值的变化则可进一步区分孔隙度变化（流体效应）和裂隙密度变化：

$$ \frac{V_p}{V_s} = \sqrt{ \frac{K}{G} + \frac{4}{3} } $$

裂隙密度增大时 $K/G$ 减小 → $V_p/V_s$ 降低。干燥裂隙的 $V_p/V_s$ 灵敏度远高于饱水裂隙，煤矿环境中这一特征需结合水文条件解读。

2.2 各向同性压应力下的裂隙行为（静水压力）

在静水压力条件下（ $\sigma_1 \approx \sigma_2 \approx \sigma_3$ ），所有方向的裂隙受到均匀压应力：

裂隙面法向应力 $\sigma_n \approx \sigma_1$ ，各方向一致
所有方向的已有裂隙均被压缩闭合
→ $K, G$ 整体升高 → $V_p$ 均匀升高
→ 介质保持各向同性（各方向波速相等）

这种情况在煤矿中对应未受采掘扰动影响的深部原岩区。

2.3 偏应力下的各向异性响应（煤矿典型状态）

在偏应力条件下（ $\sigma_1 \gg \sigma_3$ ），不同取向的裂隙行为截然不同，介质产生应力诱导的各向异性：

裂隙取向	受力状态	裂隙行为	对模量的影响	对 $V_p$ 的影响
裂隙面垂直于 $\sigma_1$	裂隙面法向应力 $ = \sigma_1$ （最大）	被压合闭合	$K \uparrow, G \uparrow$	平行 $\sigma_1$ 方向的 $V_p$ 升高
裂隙面平行于 $\sigma_1$	裂隙面法向应力 $ = \sigma_3$ （最小）	翼形裂隙向外扩展	$K \downarrow, G \downarrow$	垂直 $\sigma_1$ 方向的 $V_p$ 降低

这两种机制的竞争导致：

$$ V_p^{\parallel} > V_p^{\perp} $$

其中 $\parallel$ 表示平行于最大主应力 $\sigma_1$ 的方向， $\perp$ 表示垂直于 $\sigma_1$ 的方向。

S 波分裂的物理来源：

横波进入各向异性介质后，分裂为偏振方向互相垂直的快波和慢波（类似光进入双折射晶体）。快波偏振方向 = 裂隙最密集方向 = 最大主应力 $\sigma_1$ 方向。因此，S 波分裂参数（快波偏振方向、快慢波时差）可以直接反演应力方向和各向异性强度。Crampin（1978）的广泛扩张各向异性（EDA）模型是这一现象的理论基础。

2.4 波速变化的非单调性：先升后降

波速并非单调下降。在不同应力阶段，压合效应与新生裂隙效应此消彼长：

阶段一：低应力阶段（已存在的裂隙被压合）

原生裂隙（层面裂隙、节理、构造裂隙）在采掘应力初期被压合 → $K, G$ 小幅提升 → $V_p$ 小幅上升（通常 < 1%）。

阶段二：中等应力阶段（翼形裂隙新生）

随着偏应力增大，平行于 $\sigma_1$ 的裂隙末端开始出现翼形裂隙（wing crack），向外弯曲扩展 → 裂隙密度增加 → $V_p$ 开始从峰值下降。

阶段三：高应力阶段（临近破裂）

翼形裂隙大量互联、贯通 → 裂隙密度急剧增大 → $V_p$ 显著下降（可达 2-5%）。此时微震事件的 $b$ 值也同步下降（Class 1 已讨论）。

阶段四：破裂发生后（弹性恢复）

宏观破裂释放应力 → 部分裂隙弹性回弹闭合 → $V_p$ 快速小幅恢复（通常 < 1%，恢复量取决于裂隙的不可逆变形成分）。

非单调性对统计的影响：

6 小时窗口的满足率仅 35.7%（低于随机基线 50%），正是因为极短窗口捕捉的是破裂后的弹性恢复期——事件发生前几个小时的波速处于最低点，事件后几个小时的波速正在反弹，"前低后高"占主导，与总体"前高后低"规律相反。

2.5 孔隙压力的叠加效应

煤矿中，煤层瓦斯的孔隙压力是另一个不可忽略的因素。有效应力原理（Terzaghi, 1923）：

$$ \sigma_{\text{eff}} = \sigma_{\text{total}} - P_{\text{pore}} $$

其中 $P_{\text{pore}}$ 为孔隙流体压力。孔隙压力升高 → 有效正应力下降 → 裂隙面摩擦力减小 → 裂隙更容易张开 → $V_p$ 下降。

在煤矿环境中，偏应力机制（翼形裂隙扩展）和孔隙压力机制（有效应力下降）同时存在且均可导致波速下降。二者对 $V_p/V_s$ 的效应不同——孔隙压力变化主要影响 $K$ （降低 $V_p/V_s$ ），而裂隙密度变化同时影响 $K$ 和 $G$ （降低 $V_p/V_s$ 但幅度不同）——这在理论上可通过联合反演 $V_p$ 和 $V_s$ 的变化来区分。

2.6 完整应力-波速链路总结

阶段	主导机制	波速变化	波速变化量级	各向异性
低应力（原岩）	各向同性压实，原生裂隙闭合	略升	+0.5% ~ +1%	弱
中等偏应力	竖立裂隙翼形开始生长	各向异性增强，垂直 $\sigma_1$ 方向波速开始下降	-1% ~ -2%	增强
高应力（临近破裂）	翼形裂隙大量扩展、级联	所有方向波速显著下降	-2% ~ -5%	强
破裂后	应力卸载，裂隙弹性回弹	波速快速小幅恢复	+0.5% ~ +1.5%	减弱

三、噪声互相关测量 dv/v

3.1 为什么不用微震事件测波速

微震事件用于测量波速面临两个根本性限制：

震源位置不确定： 每次微震事件来自不同位置，波传播路径不同，无法保证测量的是同一路径上的波速变化。路径变化与波速变化互相混淆，无法可靠分离。
事件稀疏且不均匀： 大能量事件发生频率低（本研究 22 个月仅 36 个可用事件），无法提供连续、等间隔的波速监测。

噪声互相关方法的优势： 台站位置固定 → 传播路径固定 → 任何互相关走时变化 $\delta t$ 反映的仅仅是同一路径上的波速变化 $\delta v$ 。

3.2 背景噪声的物理本质

背景噪声（Ambient Seismic Noise）是地震仪持续记录的微小振动信号。其优势在于：

无处不在： 即使没有地震事件，地表的微震（海浪、风、交通、机械振动）也持续产生弹性波
路径固定： 给定台站对之间的噪声传播路径是固定的
长期稳定： 噪声源虽然在变化，但经过长时间叠加（stack），随机成分互相对消，相干成分累积

背景噪声的主要频率范围：0.05-2 Hz（煤矿场景中受机械噪声影响，有效频带可能偏向更高频）。

噪声源在煤矿环境中的特殊性：

与传统天然地震学依赖的海洋微震（0.05-0.5 Hz）不同，煤矿中的背景噪声主要来自：

采煤机、掘进机、运输机等机械振动（>2 Hz）
液压支架移架产生的瞬态振动
爆破作业（瞬时宽频）
通风系统持续振动

这些人为噪声源虽然"不自然"，但从噪声互相关的角度看，只要是持续存在的、有固定传播路径的信号，就是可用的。

3.3 互相关（Cross-Correlation）的数学定义

两个信号 $x(t)$ 和 $y(t)$ 的互相关函数 $C_{xy}(\tau)$ 定义为：

$$ C_{xy}(\tau) = \int_{-\infty}^{\infty} x(t) \cdot y(t + \tau) , dt $$

离散形式（实际计算中使用）：

$$ C_{xy}(\tau) = \sum_{t} x[t] \cdot y[t + \tau] $$

物理含义： 将信号 $y$ 沿时间轴滑动 $\tau$ ，在每个位移量 $\tau$ 处计算两信号的重叠积分（相似度）。互相关函数的最大值对应的 $\tau$ 即为两信号之间的真实时间延迟。

直观示例：

x = [0, 0, 1, 0, 0]          信号 x：时刻 2 有一个脉冲
y = [0, 0, 0, 1, 0]          信号 y：时刻 3 有一个脉冲（晚 1 个采样点）

C(τ=0) = 0×0 + 0×0 + 1×0 + 0×1 + 0×0 = 0      ← 不对齐
C(τ=1) = 0×0 + 0×0 + 1×1 + 0×0 + 0×0 = 1      ← 峰值！找到真实延迟
C(τ=2) = 0×0 + 0×1 + 1×0 + 0×0 + 0×0 = 0      ← 过冲

3.4 FFT 加速原理

直接计算互相关的时域滑动复杂度为 $O(N^2)$ ，对于长时间连续波形（小时级 × 500 Hz 采样 = 百万级采样点）不可行。

通过卷积定理可以在频域高效计算：

$$ \mathcal{F}{C_{xy}(\tau)} = X^*(f) \cdot Y(f) $$

其中 $X^*(f)$ 是 $x(t)$ 的 Fourier 变换的复共轭。

计算流程：

FFT： $X(f) = \mathcal{F}{x(t)}$ ， $Y(f) = \mathcal{F}{y(t)}$
互功率谱： $S_{xy}(f) = X^*(f) \cdot Y(f)$
IFFT： $C_{xy}(\tau) = \mathcal{F}^{-1}{S_{xy}(f)}$

复杂度降为 $O(N \log N)$ ，使得小时级的噪声互相关计算成为可能。

相位差的物理含义：

如果 $y(t)$ 是 $x(t)$ 延迟了 $\Delta t$ ，即 $y(t) = x(t - \Delta t)$ ，由 Fourier 变换的位移性质：

$$ Y(f) = X(f) \cdot e^{-i 2\pi f \Delta t} $$

互功率谱的相位：

$$ \arg\left[ X^*(f) \cdot Y(f) \right] = \arg\left[ |X(f)|^2 \cdot e^{-i 2\pi f \Delta t} \right] = -2\pi f \Delta t $$

因此，相位是频率的线性函数，斜率为 $-2\pi \Delta t$ 。对所有频率的相位信息汇总（通过 IFFT），峰值即逼近真实的 $\Delta t$ 。

3.5 噪声互相关提取走时的物理逻辑

噪声源 S 持续激发弹性波
  │
  ├→ 先到达台站 A（时刻 t₀ + d_SA / v）
  │
  └→ 后到达台站 B（时刻 t₀ + d_SB / v）
      时间差 Δt = (d_SB − d_SA) / v 依赖于 S 的位置

问题：噪声源 S 的位置未知且随时间变化！

解决：长时间叠加（stack）
  ├→ 不同时刻、不同位置的噪声源产生不同的传播路径
  ├→ 对各段短时噪声分别做互相关
  └→ 将所有短时互相关叠加（stack）

叠加结果：
  ├→ 随机路径的波：相位随机，叠加后互相抵消
  └→ 沿 A↔B 直线传播的面波和体波：相位相干，叠加后累积增强
       → 互相关峰值出现在 τ* = d_AB / v（A→B 传播走时）

这一原理的核心是格林函数重建：两个台站记录的环境噪声的互相关函数，收敛于两站之间的弹性波格林函数（即如果在 A 处有一个脉冲源，在 B 处记录到的响应）。这一定理由 Lobkis & Weaver (2001) 在超声实验中首次验证，随后被 Campillo & Paul (2003) 和 Shapiro & Campillo (2004) 推广到地震学。

数据来源说明：每个 .stk 文件（如 BDS.CCH.stk ）即台站对 BDS-CCH 在某一小时内所有短时窗口的叠加互相关结果，每一行对应一个小时。

3.6 dv/v 的测量公式推导

设台站 A 和 B 之间的真实距离为 $d$ （固定不变），波速为 $v$ ，则走时为：

$$ \Delta t = \frac{d}{v} $$

当波速发生微小变化 $v \to v + \delta v$ （ $\delta v \ll v$ ）时，走时变为：

$$ \Delta t + \delta t = \frac{d}{v + \delta v} $$

对右端做 Taylor 展开：

$$ \frac{d}{v + \delta v} = \frac{d}{v} \cdot \frac{1}{1 + \delta v / v} \approx \frac{d}{v} \cdot \left(1 - \frac{\delta v}{v} + \cdots\right) = \Delta t \cdot \left(1 - \frac{\delta v}{v}\right) $$

因此走时变化与波速变化的关系为：

$$ \delta t = -\Delta t \cdot \frac{\delta v}{v} $$

重新整理得到 dv/v 的测量公式：

$$ \frac{\delta v}{v} = -\frac{\delta t}{\Delta t} $$

关键结论：

波速下降（ $\delta v < 0$ ） → 走时增加（ $\delta t > 0$ ） → 互相关峰值向右偏移
波速上升（ $\delta v > 0$ ） → 走时减少（ $\delta t < 0$ ） → 互相关峰值向左偏移

子采样精度（Subsample Precision）：

互相关峰值不一定在整数采样点上。实际使用二次或三次插值在峰值附近拟合抛物线，以子采样精度（subsample precision）确定峰值位置 $\tau^*$ 。对于 500 Hz 采样率，采样间隔为 2 ms，子采样插值可将走时测量精度提升至 0.1 ms 量级，对应的 dv/v 精度约为：

$$ \frac{\delta v}{v} \approx \frac{0.1\ \text{ms}}{100\ \text{ms}} = 0.1% $$

（假设传播走时 $\Delta t \approx 100$ ms）

3.7 多台站对合并

实际监测中，每个台站对独立测量一个 dv/v 时序。将所有有效台站对的 dv/v 取中位数（而非均值，以抵抗个别台站对的异常值），得到代表整个监测区域的平均 dv/v 时序：

$$ \left( \frac{\delta v}{v} \right)_{\text{median}} = \text{median}_{k} \left{ \left( \frac{\delta v}{v} \right)_k \right}, \quad k = 1, \dots, N_{\text{pairs}} $$

本研究使用 9 个有效台站的 15 个台站对，平均每小时的可用台站对数为 15.9。

四、"前高后低"统计规律

4.1 规律的陈述

对 28 个大能量事件（ $E > 10^5\ \text{J}$ ）的统计分析发现：

事件发生前 T 小时的 dv/v 均值 > 事件发生后 T 小时的 dv/v 均值

换句话说，大能量事件发生之前的平均波速系统性高于事件之后的平均波速。这一规律的统计显著性依赖于窗口长度 T 的选择。

4.2 物理机制

"前高后低"的物理本质是波速变化的非单调过程（见第 2.4 节）：

事件前： 应力积累阶段，原生裂隙被压合 → 波速处于偏高水平（虽然临近破裂时波速会下降，但长窗口的平均效应掩盖了短时下降）
事件后： 应力卸载，裂隙弹性回弹但不可逆损伤保留 → 波速整体低于事件前的平均水平

实验室验证： Scuderi et al. (2016, Nature Geoscience) 在实验室断层摩擦实验中，直接测量了加载全过程的 $V_p$ 变化——断层破裂前 $V_p$ 系统性下降约 1%，破裂后部分恢复但未回到原位。这一发现为煤矿现场观测中的"前高后低"提供了直接的物理依据。

4.3 最优窗口 T_opt 的确定

对窗口长度 T 从 6h 到 726h、步长 12h 进行遍历统计，计算每个窗口下满足"事件前 dv/v 均值 > 事件后 dv/v 均值"的事件比例：

窗口 T	满足率	解读
6h	35.7%	低于随机基线（50%） — 极短窗口捕捉破裂后弹性恢复，"前低后高"占主导
30h	46.4%	仍低于基线，恢复效应大于前兆信号
120h	67.9%	超过基线，前兆信号开始显现
210h	75.0%	峰值，T_opt
222h	75.0%	并列峰值
234h	75.0%	并列峰值
400h	64.3%	开始下降，信号被稀释
726h	46.4%	趋近随机基线

结论：最优窗口 $T_{\text{opt}} \approx 210$ h（约 9 天）。

物理含义：冲击地压前兆的完整波速变化过程（从波速开始偏离背景值到事件发生）平均持续约 9 天。这也意味着 dv/v 作为前兆指标的有效预警窗口约为 9 天。

4.4 统计显著性与不确定性

28 个样本下，75% 满足率（21/28 事件满足"前高后低"规律）的 95% 置信区间（基于 Clopper-Pearson 精确方法）：

$$ \text{CI}_{95%} \approx [55%, 89%] $$

下限 55% 仅略高于随机基线 50%，上限 89% 非常乐观。样本量小导致置信区间宽，这一不确定性需要在后续建模中予以考量。

Brenguier 等人的验证： Brenguier et al. (2008, Nature Geoscience) 在 Piton de la Fournaise 火山观测中，利用噪声互相关在火山喷发前数天至数周检测到 0.2-0.5% 的 dv/v 下降，恢复完成需数周。时间尺度（数天至数周）与本研究的 9 天窗口在量级上一致。

4.5 文献支撑与可信度评估

层次	评估等级	说明
噪声互相关方法	✓ 高可信	Nature Geoscience 多篇验证，方法成熟
波速下降前兆规律	✓ 高可信	Scuderi 2016 实验室直接验证
时间尺度（~9 天）	△ 中等可信	与 Brenguier 2008 一致，但未独立验证
煤矿冲击地压具体应用	△ 创新空间	尚无直接先例，本研究首次在煤矿场景验证
210h 结论的统计置信度	△ 中等可信	28 样本，75% 满足率，CI 较宽

核心参考文献：

Brenguier, F., et al. (2008). Towards forecasting volcanic eruptions using seismic noise. Nature Geoscience, 1(2), 126-130.
Scuderi, M. M., et al. (2016). Precursory changes in seismic velocity for the spectrum of earthquake failure modes. Nature Geoscience, 9(9), 695-700.
Campillo, M., & Paul, A. (2003). Long-range correlations in the diffuse seismic coda. Science, 299(5606), 547-549.

五、标签设计

5.1 核心原则：实时可用性

任何标签（label）的设计必须满足一个硬性约束：标签的生成不依赖未来信息。在实时预警场景中，当前时刻只能看到当前及历史数据，不能使用事件发生后的波速信息。

常见陷阱：

使用事件前后的完整波速序列计算全局均值，将高于均值的时间段标为"前兆" → 需要知道事件后的波速，实时不可用
使用未来窗口的 dv/v 状态定义当前时刻的标签 → 信息泄露

正确原则：

标签仅基于事件发生时刻和固定的历史窗口来定义，完全不需要事件之后的数据：

大能量事件发生前 T_opt 小时内 → label = 1（前兆状态）
其余时刻                     → label = 0（正常状态）

5.2 重叠窗口问题与处理

当两个大能量事件的时间间隔小于 $T_{\text{opt}}$ （210h）时，后一个事件的前兆窗口会包含前一个事件发生之后的波速恢复期。恢复期的波速特征（反弹）与正常状态不同，可能污染标签。

重叠污染示意：

事件 A >────210h 前兆窗口────> [A发生]
                                    │
  事件 B 前兆窗口 >──────┬──────────┤
                          │  重叠区：包含事件A后的恢复期
                          │  → 这个区间的dv/v特征既不是"前兆"也不是"正常"

方案 B（选定方案）：截断前兆窗口

每个事件的有效前兆窗口 = [上一事件发生时刻, 本事件发生时刻)，最长不超过 210h
有效窗口 < 48h 的事件丢弃（信息量不足且污染严重）
大能量事件发生后 48h 内不纳入负样本（恢复期不等于正常状态）

三种方案的比较：

方案	可用事件数	正样本时长估算	标签质量	数据量
A（前间隔 > 210h，最干净）	14 / 36	~2940h	最高	最少
B（截断，有效窗口 ≥ 48h）	26 / 36	~3100h	高	中等
C（保持原样，重叠不处理）	36 / 36	~4265h	低（污染严重）	最多

选择方案 B 的理由：在标签质量和样本量之间取得平衡。26 个事件提供了足够的统计基础，同时避免了严重的标签污染。

5.3 类别不平衡问题

正样本（前兆状态）的总时长约 3100h，负样本（正常状态）约 12900h（总时长 15984h 减去正样本 3100h）。类别比例约为：

$$ \frac{\text{正样本}}{\text{负样本}} \approx \frac{3100}{12900} \approx 1:4 $$

这一不平衡程度尚可接受，但需在模型训练中使用类别权重（class_weight）或过采样（如 SMOTE）予以处理。评估指标中，AUC-ROC 对类别不平衡相对鲁棒，而精确率（Precision）和 F1 可能受明显影响——应优先使用 AUC-ROC 作为主评估指标。

六、数据基础

6.1 完整时序概述

数据处理流程已完成的输出为一个统一的时间序列数据集：

属性	值
文件名	`mcstk_东滩_完整.xlsx`
时间范围	2023-07-27 ~ 2025-05-22（22 个月）
时间分辨率	1 小时
总时间点数	15,984
dv/v 缺失率	8.9%（1423 个缺失小时）
平均有效台站对数	15.9 对/小时
dv/v 范围	约 −0.020 ~ +0.010
dv/v 均值	−0.0037
dv/v 标准差	~0.003

6.2 处理流程

153 个 .stk.xlsx 文件（每个台站对一个文件）
    │
    ├→ 筛选有效台站：9 个台站 → 15 个台站对（C(9,2)-重复-无效=15）
    │
    ├→ 每对台站：读取每小时 dv/v
    │
    ├→ 每小时：取 15 个台站对 dv/v 的中位数 → 单一时序
    │
    ├→ 合并东滩能量目录（微震定位和能量信息）
    │
    └→ 输出：mcstk_东滩_完整.xlsx

6.3 可用事件统计

筛选条件	事件数
`HE_events.csv` 中 $E > 10^5$ J 的事件总数	54
时序覆盖范围内的事件	36
方案 B 可用事件	26

36 个时序覆盖事件中，10 个因重叠窗口不足 48h 被方案 B 丢弃。

6.4 缺失数据处理

dv/v 的 8.9% 缺失率主要由以下原因导致：

台站离线（设备维护、供电中断）
信噪比过低（采掘活动干扰、噪声源减弱）
互相关波形质量不达标

处理策略（在特征工程中实施）：

短缺失（<6h）： 线性插值
长缺失（≥6h）： 标记为 NaN，滑动窗口计算时跳过（不对缺失段做假数据）
缺失模式与事件关联分析： 需检查台站离线是否集中在大能量事件前后——若是，则缺失本身可能是前兆信号，需特殊处理

七、下一步：特征工程

7.1 总体策略

基于 $T_{\text{opt}} = 210$ h 和方案 B 标签，构建以小时为步长的滑动窗口特征。每个特征在每小时更新，仅使用当前时刻及之前的数据（保证实时可用）。

7.2 特征设计

特征 1：短窗/长窗均值比

$$ F_1(t) = \frac{ \frac{1}{12} \sum_{i=0}^{11} dv/v(t-i) }{ \frac{1}{120} \sum_{j=0}^{119} dv/v(t-j) } $$

捕捉 dv/v 的相对下降。当 $F_1(t) < 1$ 且持续下降时，说明近期波速相对于历史基线在下降，为危险信号。比值形式对 dv/v 的绝对偏移和基线漂移不敏感。

特征 2：线性趋势斜率（滑动 OLS）

对过去 48 小时的 dv/v 做普通最小二乘（OLS）拟合：

$$ dv/v(t) = \beta_0 + \beta_1 \cdot t + \varepsilon $$

特征值： $F_2(t) = \beta_1$ （斜率）。

下降速率大（ $\beta_1$ 显著为负）→ 波速正在快速下降 → 应力集中加剧 → 危险信号。

特征 3：Z-score 偏离度

$$ F_3(t) = \frac{ dv/v(t) - \mu_{120}(t) }{ \sigma_{120}(t) } $$

其中 $\mu_{120}(t)$ 和 $\sigma_{120}(t)$ 分别是过去 120 小时 dv/v 的均值和标准差。

Z-score 量化当前波速偏离历史基线的统计显著性。通常 $F_3 < -2$ （两倍标准差以下）视为显著异常。

特征 4：滑动标准差（波动性）

$$ F_4(t) = \sigma_{24}(t) = \text{std}\big[ dv/v(t), dv/v(t-1), \dots, dv/v(t-23) \big] $$

波速的短期波动增大可能是裂隙加速扩展、介质不稳定的信号。

特征 5：微震能量与频次特征

结合微震目录，计算：

$$ F_{5a}(t) = \log_{10} \sum_{i \in [t-24, t]} E_i \quad \text{（近 24h 能量累积对数）} $$

$$ F_{5b}(t) = \frac{ N_{\text{events}}(t, t-6) }{ N_{\text{events}}(t-6, t-24) / 3 } - 1 \quad \text{（短窗 vs 长窗频次比）} $$

微震能量释放加速和频次异常增加是冲击地压的经典短临前兆。

特征 6：波速-能量协同性

$$ F_6(t) = \text{corr}\big[ dv/v(t:i), \log E(t:i) \big], \quad i = 1, \dots, 48 $$

计算过去 48 小时内 dv/v 和微震能量的滑动相关系数。负相关增强（波速下降同时能量增大）表明两种前兆信号正在同步强化，降低误报概率。

7.3 模型路线图

阶段	模型	说明
基线	XGBoost	可解释性强，训练快速，处理缺失值鲁棒
时序模型	TCN（Temporal Convolutional Network）	捕获长时间依赖，训练效率高于 LSTM
对比模型	LSTM / BiLSTM	经典时序模型，用于与 TCN 对比
可选	Transformer	如果数据量允许（可考虑跨工作面迁移学习）

7.4 评估指标体系

指标	含义	目标
AUC-ROC	不同阈值下 TPR vs FPR 曲线下面积	>0.75（显著优于随机）
Recall @ FPR=0.1	在 10% 误报率下的召回率	>50%（至少一半事件被提前预警）
平均预警提前量	首次触发预警到事件发生的时间	>24h（有足够时间采取行动）
误报频率	每百天触发预警的次数	<5 次/百天（避免预警疲劳）

注：平均预警提前量需要在训练时防止标签泄漏——不能使用事件后数据来优化预警时间的定位。

[Mine Earthquake]Class2