煤矿冲击地压波速前兆提取学习笔记 · Class 2
从物理机制出发,理解噪声互相关测量 dv/v 的完整链路及前兆提取方法
目录
一、冲击地压的物理本质
1.1 定义与机制
冲击地压(Rock Burst)是煤矿深部开采中一种典型的动力灾害。其根本物理过程可以表述为:高应力作用下,煤岩体内储存的弹性应变能发生突发性、不可控的释放,导致围岩瞬间失稳破坏,并以弹性波(地震波)的形式向四周辐射能量。
完整过程链:
构造应力 / 采掘扰动
→ 围岩应力重分布 → 局部应力集中
→ 微裂隙从随机生长转为定向扩展
→ 裂隙级联、贯通 → 破裂成核
→ 岩体突然失稳破裂
→ 弹性应变能以地震波形式释放 → 冲击地压
1.2 能量视角
从能量角度,冲击地压的本质是弹性应变能 $U_e$ 的积累-释放过程。单位体积的弹性应变能为:
$$ U_e = \frac{1}{2E} \left[ \sigma_1^2 + \sigma_2^2 + \sigma_3^2 - 2\nu(\sigma_1\sigma_2 + \sigma_2\sigma_3 + \sigma_3\sigma_1) \right] $$
其中 $E$ 为弹性模量, $\nu$ 为泊松比, $\sigma_1, \sigma_2, \sigma_3$ 为主应力。
在单轴简化情况下(煤矿回采空间附近近似):
$$ U_e = \frac{\sigma^2}{2E} $$
以典型煤矿参数估算:若 $\sigma = 30\ \text{MPa}$ , $E = 5\ \text{GPa}$ ,则 $U_e \approx 90\ \text{kJ/m}^3$ 。一个体积为 $100\ \text{m}^3$ 的破坏区域释放的总应变能约 $9\ \text{MJ}$ ,相当于约 2 kg TNT 当量——足以造成严重的巷道破坏。
1.3 应力积累阶段的关键信号
煤岩体在宏观破坏之前经历了一个复杂的微破裂演化过程,可以分为以下阶段(参考 Brace et al., 1966 和 Scholz, 1968 的实验室岩石力学研究):
| 阶段 | 应力水平(占峰值百分比) | 微裂隙行为 | 可观测信号 |
|---|---|---|---|
| 裂隙压密 | 0-20% | 原生裂隙闭合 | 波速略升 |
| 弹性变形 | 20-40% | 无明显新裂隙 | 波速稳定 |
| 裂隙稳定扩展 | 40-70% | 翼形裂隙开始生长 | 波速开始各向异性下降 |
| 裂隙加速扩展 | 70-90% | 裂隙级联合并、贯通 | 波速显著下降,声发射加速 |
| 宏观破裂 | >90% | 裂隙网络整体贯通 | 波速骤降,大能量事件 |
核心要点: 微裂隙的演化在宏观破坏之前就已开始,且通过波速变化可以被观测到——这正是波速作为前兆指标的物理基础。
二、应力-裂隙-波速的关系
2.1 弹性波速的基本公式
地震波的传播速度由介质的弹性模量和密度决定。对于各向同性弹性介质:
P 波速度:
$$ V_p = \sqrt{ \frac{K + \frac{4}{3}G}{\rho} } $$
S 波速度:
$$ V_s = \sqrt{ \frac{G}{\rho} } $$
其中:
- $K$ :体积模量(Bulk Modulus),抵抗体积压缩的能力
- $G$ :剪切模量(Shear Modulus),抵抗形状改变的能力
- $\rho$ :介质密度
从公式可以直接推导波速变化的方向性信号:
- 裂隙张开 → 介质抵抗形变能力降低 → $K \downarrow, G \downarrow$ → $V_p \downarrow, V_s \downarrow$
- 裂隙闭合 → 介质抵抗形变能力增强 → $K \uparrow, G \uparrow$ → $V_p \uparrow, V_s \uparrow$
$V_p/V_s$ 比值的变化则可进一步区分孔隙度变化(流体效应)和裂隙密度变化:
$$ \frac{V_p}{V_s} = \sqrt{ \frac{K}{G} + \frac{4}{3} } $$
裂隙密度增大时 $K/G$ 减小 → $V_p/V_s$ 降低。干燥裂隙的 $V_p/V_s$ 灵敏度远高于饱水裂隙,煤矿环境中这一特征需结合水文条件解读。
2.2 各向同性压应力下的裂隙行为(静水压力)
在静水压力条件下( $\sigma_1 \approx \sigma_2 \approx \sigma_3$ ),所有方向的裂隙受到均匀压应力:
- 裂隙面法向应力 $\sigma_n \approx \sigma_1$ ,各方向一致
- 所有方向的已有裂隙均被压缩闭合
- → $K, G$ 整体升高 → $V_p$ 均匀升高
- → 介质保持各向同性(各方向波速相等)
这种情况在煤矿中对应未受采掘扰动影响的深部原岩区。
2.3 偏应力下的各向异性响应(煤矿典型状态)
在偏应力条件下( $\sigma_1 \gg \sigma_3$ ),不同取向的裂隙行为截然不同,介质产生应力诱导的各向异性:
| 裂隙取向 | 受力状态 | 裂隙行为 | 对模量的影响 | 对 $V_p$ 的影响 |
|---|---|---|---|---|
| 裂隙面垂直于 $\sigma_1$ | 裂隙面法向应力 $ = \sigma_1$ (最大) | 被压合闭合 | $K \uparrow, G \uparrow$ | 平行 $\sigma_1$ 方向的 $V_p$ 升高 |
| 裂隙面平行于 $\sigma_1$ | 裂隙面法向应力 $ = \sigma_3$ (最小) | 翼形裂隙向外扩展 | $K \downarrow, G \downarrow$ | 垂直 $\sigma_1$ 方向的 $V_p$ 降低 |
这两种机制的竞争导致:
$$ V_p^{\parallel} > V_p^{\perp} $$
其中 $\parallel$ 表示平行于最大主应力 $\sigma_1$ 的方向, $\perp$ 表示垂直于 $\sigma_1$ 的方向。
S 波分裂的物理来源:
横波进入各向异性介质后,分裂为偏振方向互相垂直的快波和慢波(类似光进入双折射晶体)。快波偏振方向 = 裂隙最密集方向 = 最大主应力 $\sigma_1$ 方向。因此,S 波分裂参数(快波偏振方向、快慢波时差)可以直接反演应力方向和各向异性强度。Crampin(1978)的广泛扩张各向异性(EDA)模型是这一现象的理论基础。
2.4 波速变化的非单调性:先升后降
波速并非单调下降。在不同应力阶段,压合效应与新生裂隙效应此消彼长:
阶段一:低应力阶段(已存在的裂隙被压合)
原生裂隙(层面裂隙、节理、构造裂隙)在采掘应力初期被压合 → $K, G$ 小幅提升 → $V_p$ 小幅上升(通常 < 1%)。
阶段二:中等应力阶段(翼形裂隙新生)
随着偏应力增大,平行于 $\sigma_1$ 的裂隙末端开始出现翼形裂隙(wing crack),向外弯曲扩展 → 裂隙密度增加 → $V_p$ 开始从峰值下降。
阶段三:高应力阶段(临近破裂)
翼形裂隙大量互联、贯通 → 裂隙密度急剧增大 → $V_p$ 显著下降(可达 2-5%)。此时微震事件的 $b$ 值也同步下降(Class 1 已讨论)。
阶段四:破裂发生后(弹性恢复)
宏观破裂释放应力 → 部分裂隙弹性回弹闭合 → $V_p$ 快速小幅恢复(通常 < 1%,恢复量取决于裂隙的不可逆变形成分)。
非单调性对统计的影响:
6 小时窗口的满足率仅 35.7%(低于随机基线 50%),正是因为极短窗口捕捉的是破裂后的弹性恢复期——事件发生前几个小时的波速处于最低点,事件后几个小时的波速正在反弹,"前低后高"占主导,与总体"前高后低"规律相反。
2.5 孔隙压力的叠加效应
煤矿中,煤层瓦斯的孔隙压力是另一个不可忽略的因素。有效应力原理(Terzaghi, 1923):
$$ \sigma_{\text{eff}} = \sigma_{\text{total}} - P_{\text{pore}} $$
其中 $P_{\text{pore}}$ 为孔隙流体压力。孔隙压力升高 → 有效正应力下降 → 裂隙面摩擦力减小 → 裂隙更容易张开 → $V_p$ 下降。
在煤矿环境中,偏应力机制(翼形裂隙扩展)和孔隙压力机制(有效应力下降)同时存在且均可导致波速下降。二者对 $V_p/V_s$ 的效应不同——孔隙压力变化主要影响 $K$ (降低 $V_p/V_s$ ),而裂隙密度变化同时影响 $K$ 和 $G$ (降低 $V_p/V_s$ 但幅度不同)——这在理论上可通过联合反演 $V_p$ 和 $V_s$ 的变化来区分。
2.6 完整应力-波速链路总结
| 阶段 | 主导机制 | 波速变化 | 波速变化量级 | 各向异性 |
|---|---|---|---|---|
| 低应力(原岩) | 各向同性压实,原生裂隙闭合 | 略升 | +0.5% ~ +1% | 弱 |
| 中等偏应力 | 竖立裂隙翼形开始生长 | 各向异性增强,垂直 $\sigma_1$ 方向波速开始下降 | -1% ~ -2% | 增强 |
| 高应力(临近破裂) | 翼形裂隙大量扩展、级联 | 所有方向波速显著下降 | -2% ~ -5% | 强 |
| 破裂后 | 应力卸载,裂隙弹性回弹 | 波速快速小幅恢复 | +0.5% ~ +1.5% | 减弱 |
三、噪声互相关测量 dv/v
3.1 为什么不用微震事件测波速
微震事件用于测量波速面临两个根本性限制:
- 震源位置不确定: 每次微震事件来自不同位置,波传播路径不同,无法保证测量的是同一路径上的波速变化。路径变化与波速变化互相混淆,无法可靠分离。
- 事件稀疏且不均匀: 大能量事件发生频率低(本研究 22 个月仅 36 个可用事件),无法提供连续、等间隔的波速监测。
噪声互相关方法的优势: 台站位置固定 → 传播路径固定 → 任何互相关走时变化 $\delta t$ 反映的仅仅是同一路径上的波速变化 $\delta v$ 。
3.2 背景噪声的物理本质
背景噪声(Ambient Seismic Noise)是地震仪持续记录的微小振动信号。其优势在于:
- 无处不在: 即使没有地震事件,地表的微震(海浪、风、交通、机械振动)也持续产生弹性波
- 路径固定: 给定台站对之间的噪声传播路径是固定的
- 长期稳定: 噪声源虽然在变化,但经过长时间叠加(stack),随机成分互相对消,相干成分累积
背景噪声的主要频率范围:0.05-2 Hz(煤矿场景中受机械噪声影响,有效频带可能偏向更高频)。
噪声源在煤矿环境中的特殊性:
与传统天然地震学依赖的海洋微震(0.05-0.5 Hz)不同,煤矿中的背景噪声主要来自:
- 采煤机、掘进机、运输机等机械振动(>2 Hz)
- 液压支架移架产生的瞬态振动
- 爆破作业(瞬时宽频)
- 通风系统持续振动
这些人为噪声源虽然"不自然",但从噪声互相关的角度看,只要是持续存在的、有固定传播路径的信号,就是可用的。
3.3 互相关(Cross-Correlation)的数学定义
两个信号 $x(t)$ 和 $y(t)$ 的互相关函数 $C_{xy}(\tau)$ 定义为:
$$ C_{xy}(\tau) = \int_{-\infty}^{\infty} x(t) \cdot y(t + \tau) , dt $$
离散形式(实际计算中使用):
$$ C_{xy}(\tau) = \sum_{t} x[t] \cdot y[t + \tau] $$
物理含义: 将信号 $y$ 沿时间轴滑动 $\tau$ ,在每个位移量 $\tau$ 处计算两信号的重叠积分(相似度)。互相关函数的最大值对应的 $\tau$ 即为两信号之间的真实时间延迟。
直观示例:
x = [0, 0, 1, 0, 0] 信号 x:时刻 2 有一个脉冲
y = [0, 0, 0, 1, 0] 信号 y:时刻 3 有一个脉冲(晚 1 个采样点)
C(τ=0) = 0×0 + 0×0 + 1×0 + 0×1 + 0×0 = 0 ← 不对齐
C(τ=1) = 0×0 + 0×0 + 1×1 + 0×0 + 0×0 = 1 ← 峰值!找到真实延迟
C(τ=2) = 0×0 + 0×1 + 1×0 + 0×0 + 0×0 = 0 ← 过冲
3.4 FFT 加速原理
直接计算互相关的时域滑动复杂度为 $O(N^2)$ ,对于长时间连续波形(小时级 × 500 Hz 采样 = 百万级采样点)不可行。
通过卷积定理可以在频域高效计算:
$$ \mathcal{F}{C_{xy}(\tau)} = X^*(f) \cdot Y(f) $$
其中 $X^*(f)$ 是 $x(t)$ 的 Fourier 变换的复共轭。
计算流程:
- FFT: $X(f) = \mathcal{F}{x(t)}$ , $Y(f) = \mathcal{F}{y(t)}$
- 互功率谱: $S_{xy}(f) = X^*(f) \cdot Y(f)$
- IFFT: $C_{xy}(\tau) = \mathcal{F}^{-1}{S_{xy}(f)}$
复杂度降为 $O(N \log N)$ ,使得小时级的噪声互相关计算成为可能。
相位差的物理含义:
如果 $y(t)$ 是 $x(t)$ 延迟了 $\Delta t$ ,即 $y(t) = x(t - \Delta t)$ ,由 Fourier 变换的位移性质:
$$ Y(f) = X(f) \cdot e^{-i 2\pi f \Delta t} $$
互功率谱的相位:
$$ \arg\left[ X^*(f) \cdot Y(f) \right] = \arg\left[ |X(f)|^2 \cdot e^{-i 2\pi f \Delta t} \right] = -2\pi f \Delta t $$
因此,相位是频率的线性函数,斜率为 $-2\pi \Delta t$ 。对所有频率的相位信息汇总(通过 IFFT),峰值即逼近真实的 $\Delta t$ 。
3.5 噪声互相关提取走时的物理逻辑
噪声源 S 持续激发弹性波
│
├→ 先到达台站 A(时刻 t₀ + d_SA / v)
│
└→ 后到达台站 B(时刻 t₀ + d_SB / v)
时间差 Δt = (d_SB − d_SA) / v 依赖于 S 的位置
问题:噪声源 S 的位置未知且随时间变化!
解决:长时间叠加(stack)
├→ 不同时刻、不同位置的噪声源产生不同的传播路径
├→ 对各段短时噪声分别做互相关
└→ 将所有短时互相关叠加(stack)
叠加结果:
├→ 随机路径的波:相位随机,叠加后互相抵消
└→ 沿 A↔B 直线传播的面波和体波:相位相干,叠加后累积增强
→ 互相关峰值出现在 τ* = d_AB / v(A→B 传播走时)
这一原理的核心是格林函数重建:两个台站记录的环境噪声的互相关函数,收敛于两站之间的弹性波格林函数(即如果在 A 处有一个脉冲源,在 B 处记录到的响应)。这一定理由 Lobkis & Weaver (2001) 在超声实验中首次验证,随后被 Campillo & Paul (2003) 和 Shapiro & Campillo (2004) 推广到地震学。
数据来源说明:每个 .stk 文件(如 BDS.CCH.stk )即台站对 BDS-CCH 在某一小时内所有短时窗口的叠加互相关结果,每一行对应一个小时。
3.6 dv/v 的测量公式推导
设台站 A 和 B 之间的真实距离为 $d$ (固定不变),波速为 $v$ ,则走时为:
$$ \Delta t = \frac{d}{v} $$
当波速发生微小变化 $v \to v + \delta v$ ( $\delta v \ll v$ )时,走时变为:
$$ \Delta t + \delta t = \frac{d}{v + \delta v} $$
对右端做 Taylor 展开:
$$ \frac{d}{v + \delta v} = \frac{d}{v} \cdot \frac{1}{1 + \delta v / v} \approx \frac{d}{v} \cdot \left(1 - \frac{\delta v}{v} + \cdots\right) = \Delta t \cdot \left(1 - \frac{\delta v}{v}\right) $$
因此走时变化与波速变化的关系为:
$$ \delta t = -\Delta t \cdot \frac{\delta v}{v} $$
重新整理得到 dv/v 的测量公式:
$$ \frac{\delta v}{v} = -\frac{\delta t}{\Delta t} $$
关键结论:
- 波速下降( $\delta v < 0$ ) → 走时增加( $\delta t > 0$ ) → 互相关峰值向右偏移
- 波速上升( $\delta v > 0$ ) → 走时减少( $\delta t < 0$ ) → 互相关峰值向左偏移
子采样精度(Subsample Precision):
互相关峰值不一定在整数采样点上。实际使用二次或三次插值在峰值附近拟合抛物线,以子采样精度(subsample precision)确定峰值位置 $\tau^*$ 。对于 500 Hz 采样率,采样间隔为 2 ms,子采样插值可将走时测量精度提升至 0.1 ms 量级,对应的 dv/v 精度约为:
$$ \frac{\delta v}{v} \approx \frac{0.1\ \text{ms}}{100\ \text{ms}} = 0.1% $$
(假设传播走时 $\Delta t \approx 100$ ms)
3.7 多台站对合并
实际监测中,每个台站对独立测量一个 dv/v 时序。将所有有效台站对的 dv/v 取中位数(而非均值,以抵抗个别台站对的异常值),得到代表整个监测区域的平均 dv/v 时序:
$$ \left( \frac{\delta v}{v} \right)_{\text{median}} = \text{median}_{k} \left{ \left( \frac{\delta v}{v} \right)_k \right}, \quad k = 1, \dots, N_{\text{pairs}} $$
本研究使用 9 个有效台站的 15 个台站对,平均每小时的可用台站对数为 15.9。
四、"前高后低"统计规律
4.1 规律的陈述
对 28 个大能量事件( $E > 10^5\ \text{J}$ )的统计分析发现:
事件发生前 T 小时的 dv/v 均值 > 事件发生后 T 小时的 dv/v 均值
换句话说,大能量事件发生之前的平均波速系统性高于事件之后的平均波速。这一规律的统计显著性依赖于窗口长度 T 的选择。
4.2 物理机制
"前高后低"的物理本质是波速变化的非单调过程(见第 2.4 节):
- 事件前: 应力积累阶段,原生裂隙被压合 → 波速处于偏高水平(虽然临近破裂时波速会下降,但长窗口的平均效应掩盖了短时下降)
- 事件后: 应力卸载,裂隙弹性回弹但不可逆损伤保留 → 波速整体低于事件前的平均水平
实验室验证: Scuderi et al. (2016, Nature Geoscience) 在实验室断层摩擦实验中,直接测量了加载全过程的 $V_p$ 变化——断层破裂前 $V_p$ 系统性下降约 1%,破裂后部分恢复但未回到原位。这一发现为煤矿现场观测中的"前高后低"提供了直接的物理依据。
4.3 最优窗口 T_opt 的确定
对窗口长度 T 从 6h 到 726h、步长 12h 进行遍历统计,计算每个窗口下满足"事件前 dv/v 均值 > 事件后 dv/v 均值"的事件比例:
| 窗口 T | 满足率 | 解读 |
|---|---|---|
| 6h | 35.7% | 低于随机基线(50%) — 极短窗口捕捉破裂后弹性恢复,"前低后高"占主导 |
| 30h | 46.4% | 仍低于基线,恢复效应大于前兆信号 |
| 120h | 67.9% | 超过基线,前兆信号开始显现 |
| 210h | 75.0% | 峰值,T_opt |
| 222h | 75.0% | 并列峰值 |
| 234h | 75.0% | 并列峰值 |
| 400h | 64.3% | 开始下降,信号被稀释 |
| 726h | 46.4% | 趋近随机基线 |
结论:最优窗口 $T_{\text{opt}} \approx 210$ h(约 9 天)。
物理含义:冲击地压前兆的完整波速变化过程(从波速开始偏离背景值到事件发生)平均持续约 9 天。这也意味着 dv/v 作为前兆指标的有效预警窗口约为 9 天。
4.4 统计显著性与不确定性
28 个样本下,75% 满足率(21/28 事件满足"前高后低"规律)的 95% 置信区间(基于 Clopper-Pearson 精确方法):
$$ \text{CI}_{95%} \approx [55%, 89%] $$
下限 55% 仅略高于随机基线 50%,上限 89% 非常乐观。样本量小导致置信区间宽,这一不确定性需要在后续建模中予以考量。
Brenguier 等人的验证: Brenguier et al. (2008, Nature Geoscience) 在 Piton de la Fournaise 火山观测中,利用噪声互相关在火山喷发前数天至数周检测到 0.2-0.5% 的 dv/v 下降,恢复完成需数周。时间尺度(数天至数周)与本研究的 9 天窗口在量级上一致。
4.5 文献支撑与可信度评估
| 层次 | 评估等级 | 说明 |
|---|---|---|
| 噪声互相关方法 | ✓ 高可信 | Nature Geoscience 多篇验证,方法成熟 |
| 波速下降前兆规律 | ✓ 高可信 | Scuderi 2016 实验室直接验证 |
| 时间尺度(~9 天) | △ 中等可信 | 与 Brenguier 2008 一致,但未独立验证 |
| 煤矿冲击地压具体应用 | △ 创新空间 | 尚无直接先例,本研究首次在煤矿场景验证 |
| 210h 结论的统计置信度 | △ 中等可信 | 28 样本,75% 满足率,CI 较宽 |
核心参考文献:
- Brenguier, F., et al. (2008). Towards forecasting volcanic eruptions using seismic noise. Nature Geoscience, 1(2), 126-130.
- Scuderi, M. M., et al. (2016). Precursory changes in seismic velocity for the spectrum of earthquake failure modes. Nature Geoscience, 9(9), 695-700.
- Campillo, M., & Paul, A. (2003). Long-range correlations in the diffuse seismic coda. Science, 299(5606), 547-549.
五、标签设计
5.1 核心原则:实时可用性
任何标签(label)的设计必须满足一个硬性约束:标签的生成不依赖未来信息。在实时预警场景中,当前时刻只能看到当前及历史数据,不能使用事件发生后的波速信息。
常见陷阱:
- 使用事件前后的完整波速序列计算全局均值,将高于均值的时间段标为"前兆" → 需要知道事件后的波速,实时不可用
- 使用未来窗口的 dv/v 状态定义当前时刻的标签 → 信息泄露
正确原则:
标签仅基于事件发生时刻和固定的历史窗口来定义,完全不需要事件之后的数据:
大能量事件发生前 T_opt 小时内 → label = 1(前兆状态)
其余时刻 → label = 0(正常状态)
5.2 重叠窗口问题与处理
当两个大能量事件的时间间隔小于 $T_{\text{opt}}$ (210h)时,后一个事件的前兆窗口会包含前一个事件发生之后的波速恢复期。恢复期的波速特征(反弹)与正常状态不同,可能污染标签。
重叠污染示意:
事件 A >────210h 前兆窗口────> [A发生]
│
事件 B 前兆窗口 >──────┬──────────┤
│ 重叠区:包含事件A后的恢复期
│ → 这个区间的dv/v特征既不是"前兆"也不是"正常"
方案 B(选定方案):截断前兆窗口
- 每个事件的有效前兆窗口 = [上一事件发生时刻, 本事件发生时刻),最长不超过 210h
- 有效窗口 < 48h 的事件丢弃(信息量不足且污染严重)
- 大能量事件发生后 48h 内不纳入负样本(恢复期不等于正常状态)
三种方案的比较:
| 方案 | 可用事件数 | 正样本时长估算 | 标签质量 | 数据量 |
|---|---|---|---|---|
| A(前间隔 > 210h,最干净) | 14 / 36 | ~2940h | 最高 | 最少 |
| B(截断,有效窗口 ≥ 48h) | 26 / 36 | ~3100h | 高 | 中等 |
| C(保持原样,重叠不处理) | 36 / 36 | ~4265h | 低(污染严重) | 最多 |
选择方案 B 的理由:在标签质量和样本量之间取得平衡。26 个事件提供了足够的统计基础,同时避免了严重的标签污染。
5.3 类别不平衡问题
正样本(前兆状态)的总时长约 3100h,负样本(正常状态)约 12900h(总时长 15984h 减去正样本 3100h)。类别比例约为:
$$ \frac{\text{正样本}}{\text{负样本}} \approx \frac{3100}{12900} \approx 1:4 $$
这一不平衡程度尚可接受,但需在模型训练中使用类别权重(class_weight)或过采样(如 SMOTE)予以处理。评估指标中,AUC-ROC 对类别不平衡相对鲁棒,而精确率(Precision)和 F1 可能受明显影响——应优先使用 AUC-ROC 作为主评估指标。
六、数据基础
6.1 完整时序概述
数据处理流程已完成的输出为一个统一的时间序列数据集:
| 属性 | 值 |
|---|---|
| 文件名 | mcstk_东滩_完整.xlsx |
| 时间范围 | 2023-07-27 ~ 2025-05-22(22 个月) |
| 时间分辨率 | 1 小时 |
| 总时间点数 | 15,984 |
| dv/v 缺失率 | 8.9%(1423 个缺失小时) |
| 平均有效台站对数 | 15.9 对/小时 |
| dv/v 范围 | 约 −0.020 ~ +0.010 |
| dv/v 均值 | −0.0037 |
| dv/v 标准差 | ~0.003 |
6.2 处理流程
153 个 .stk.xlsx 文件(每个台站对一个文件)
│
├→ 筛选有效台站:9 个台站 → 15 个台站对(C(9,2)-重复-无效=15)
│
├→ 每对台站:读取每小时 dv/v
│
├→ 每小时:取 15 个台站对 dv/v 的中位数 → 单一时序
│
├→ 合并东滩能量目录(微震定位和能量信息)
│
└→ 输出:mcstk_东滩_完整.xlsx
6.3 可用事件统计
| 筛选条件 | 事件数 |
|---|---|
HE_events.csv 中 $E > 10^5$ J 的事件总数 |
54 |
| 时序覆盖范围内的事件 | 36 |
| 方案 B 可用事件 | 26 |
36 个时序覆盖事件中,10 个因重叠窗口不足 48h 被方案 B 丢弃。
6.4 缺失数据处理
dv/v 的 8.9% 缺失率主要由以下原因导致:
- 台站离线(设备维护、供电中断)
- 信噪比过低(采掘活动干扰、噪声源减弱)
- 互相关波形质量不达标
处理策略(在特征工程中实施):
- 短缺失(<6h): 线性插值
- 长缺失(≥6h): 标记为 NaN,滑动窗口计算时跳过(不对缺失段做假数据)
- 缺失模式与事件关联分析: 需检查台站离线是否集中在大能量事件前后——若是,则缺失本身可能是前兆信号,需特殊处理
七、下一步:特征工程
7.1 总体策略
基于 $T_{\text{opt}} = 210$ h 和方案 B 标签,构建以小时为步长的滑动窗口特征。每个特征在每小时更新,仅使用当前时刻及之前的数据(保证实时可用)。
7.2 特征设计
特征 1:短窗/长窗均值比
$$ F_1(t) = \frac{ \frac{1}{12} \sum_{i=0}^{11} dv/v(t-i) }{ \frac{1}{120} \sum_{j=0}^{119} dv/v(t-j) } $$
捕捉 dv/v 的相对下降。当 $F_1(t) < 1$ 且持续下降时,说明近期波速相对于历史基线在下降,为危险信号。比值形式对 dv/v 的绝对偏移和基线漂移不敏感。
特征 2:线性趋势斜率(滑动 OLS)
对过去 48 小时的 dv/v 做普通最小二乘(OLS)拟合:
$$ dv/v(t) = \beta_0 + \beta_1 \cdot t + \varepsilon $$
特征值: $F_2(t) = \beta_1$ (斜率)。
下降速率大( $\beta_1$ 显著为负)→ 波速正在快速下降 → 应力集中加剧 → 危险信号。
特征 3:Z-score 偏离度
$$ F_3(t) = \frac{ dv/v(t) - \mu_{120}(t) }{ \sigma_{120}(t) } $$
其中 $\mu_{120}(t)$ 和 $\sigma_{120}(t)$ 分别是过去 120 小时 dv/v 的均值和标准差。
Z-score 量化当前波速偏离历史基线的统计显著性。通常 $F_3 < -2$ (两倍标准差以下)视为显著异常。
特征 4:滑动标准差(波动性)
$$ F_4(t) = \sigma_{24}(t) = \text{std}\big[ dv/v(t), dv/v(t-1), \dots, dv/v(t-23) \big] $$
波速的短期波动增大可能是裂隙加速扩展、介质不稳定的信号。
特征 5:微震能量与频次特征
结合微震目录,计算:
$$ F_{5a}(t) = \log_{10} \sum_{i \in [t-24, t]} E_i \quad \text{(近 24h 能量累积对数)} $$
$$ F_{5b}(t) = \frac{ N_{\text{events}}(t, t-6) }{ N_{\text{events}}(t-6, t-24) / 3 } - 1 \quad \text{(短窗 vs 长窗频次比)} $$
微震能量释放加速和频次异常增加是冲击地压的经典短临前兆。
特征 6:波速-能量协同性
$$ F_6(t) = \text{corr}\big[ dv/v(t:i), \log E(t:i) \big], \quad i = 1, \dots, 48 $$
计算过去 48 小时内 dv/v 和微震能量的滑动相关系数。负相关增强(波速下降同时能量增大)表明两种前兆信号正在同步强化,降低误报概率。
7.3 模型路线图
| 阶段 | 模型 | 说明 |
|---|---|---|
| 基线 | XGBoost | 可解释性强,训练快速,处理缺失值鲁棒 |
| 时序模型 | TCN(Temporal Convolutional Network) | 捕获长时间依赖,训练效率高于 LSTM |
| 对比模型 | LSTM / BiLSTM | 经典时序模型,用于与 TCN 对比 |
| 可选 | Transformer | 如果数据量允许(可考虑跨工作面迁移学习) |
7.4 评估指标体系
| 指标 | 含义 | 目标 |
|---|---|---|
| AUC-ROC | 不同阈值下 TPR vs FPR 曲线下面积 | >0.75(显著优于随机) |
| Recall @ FPR=0.1 | 在 10% 误报率下的召回率 | >50%(至少一半事件被提前预警) |
| 平均预警提前量 | 首次触发预警到事件发生的时间 | >24h(有足够时间采取行动) |
| 误报频率 | 每百天触发预警的次数 | <5 次/百天(避免预警疲劳) |
注: 平均预警提前量需要在训练时防止标签泄漏——不能使用事件后数据来优化预警时间的定位。