1. 引言
随着我国工业的快速发展,对煤炭的需求量持续增大,煤矿开采深度不断增加,面临的地质环境也更加复杂 [1] [2]。尤其是在我国中东部地区,很多煤层直覆于承压含水层之上,因底板破裂引起的突水事故时常发生,给安全开采带来了极大的障碍。为解决这一问题,大量学者和现场工作者对此进行了研究,其中关于底板采动破坏深度的研究一直是热点课题之一 [3] [4]。目前,底板采动破坏深度确定的常用方法有四种:理论计算、现场实测、数值模拟和相似模拟。理论计算法不但需要现场实测数据作为基础,为简化计算还进行了诸多假设,导致结果往往与实际存在较大误差;现场实测虽然是目前获得底板破坏深度最准确、最可靠的一种方法,但该方法受限于地质环境,实施较为复杂;数值模拟虽计算简单,处理方便,但采用有限差分原理,计算结果往往也不符合实际;相似模拟是对现场环境的室内还原,可靠度较高,但成本较高。不宜大量使用。随着科学计算的兴起,基于统计学原理对底板破坏深度进行确定成为了当前研究的重要手段 [5],该类方法较常规方法更为方便,结果可靠度更高。前人在这方面也做了大量工作。本文在前人研究成果的基础上,通过对基于统计学方法的底板采动破坏深度的相关研究进行了阐述,包括回归分析、支持向量机、灰色预测和BP神经网络,系统地梳理了各种研究方法的原理、计算过程以及前人所作的工作等,旨在能够为相关研究提供一定的参考。
2. 底板采动破坏深度确定的统计学方法
2.1. 回归分析
回归分析是以定量形式表征系统变量相关关系的一种统计分析方法,其中最常用的是多元线性回归,其假设多个自变量和因变量之间存在线性关系,通过求取参数建立数学模型 [6],如公式(1)所示:
(1)
上式可以简化表示为:
(2)
式中:
为因变量,
为截距项,
为待求参数,
为自变量,
为误差项。
回归方程分线性部分和误差项两部分,其共同解释因变量的变化规律。对于回归模型,其待求参数一般通过最小二乘法求得,确定α和β即确定了回归方程,即可对结果进行预测。回归分析可广泛应用于各领域,基于多元线性回归对底板破坏深度进行预测是在理论计算的基础上应用最早、也是最为简单的一类统计学研究方法,很多学者对此进行了研究。李小孟 [7] 等结合工程实例采用用多元线性回归对底板破坏深度进行了预测,对比实测数据,二者结果基本相同。段宏飞 [8]、张风达 [9] 等均在分析影响底板破坏深度的因素的基础上,采用回归分析方法建立了底板破坏深度预测模型,实现了底板破坏深度的预测。
2.2. 支持向量机
支持向量机是一种基于深度学习的广义分类算法,常用以进行识别分类及回归分析。支持向量机与其它算法相比优势在于可以对复杂非线性方程进行深度学习。支持向量机用以进行回归分析称为支持向量回归 [10]。
在支持向量回归模型中,存在初始样本
,
,期望通过反复学习得到回归模型
,使得
,
即为所求结果,其计算过程如下:
假设
与y之间存在最大偏差ε,当且仅当
时才计算损失,如图1所示。
Figure 1. Support vector regression model
图1. 支持向量回归模型
则支持向量回归问题可表示为:
(3)
式中:C——正则化常数,w,b——待求参数,lε——不敏感损失函数,lε函数示意图如图2所示。
lε函数表达式为:
(4)
引入松弛变量
和
,则式(3)可重写为:
(5)
引入拉格朗日乘子μi,
Figure 2.Insensitive loss function lε
图2. 不敏感损失函数lε
(6)
再令
对
的偏导数为零可得:
(7)
上述过程中需满足下列条件:
(8)
则模型的解为:
(9)
若
,则必有
。
(10)
基于以上原理,确定w和b的支持向量回归模型即可实现参数预测。支持向量回归算法较普通回归算法精度更高、且适用性强,很多学者采用支持向量回归算法对底板破坏深度进行了研究。柳聪亮 [11] 等采用支持向量机创建了预测底板采动导水破坏带深度的回归计算模型。通过国内一些矿区实测成果对模型进行反复训练,模型预测结果和实测结果基本相同,可以较好地满足工程设计需要。韩进 [12] 等运用遗传算法和支持向量机融合分析,以深部煤层底板破坏数据为样本,构建了底板破坏深度与其影响因素间的非线性模型,得出了模型预测结果。
2.3. 灰色预测
灰色预测法是一种基于灰色理论对具有波动因素的系统进行预测的统计学方法。其原理主要是通过鉴别单系统或多系统因素之间发展趋势的内在相异性和变化程度,确定系统影响因素的关联度,生成初始数据序列,确定系统变化的基本规律,从而实现对事物发展趋势的预测。
GM(0, N)是常用的灰色预测数学模型 [13],其可以表示为:
(11)
式中:a、bi为待定系数,i为样本数据序列个数,
;
记样本数据序列为:
,n表示样本数据序列个数,m表示单个样本数据序列中的元素个数。一次累加后,数据序列为:
。
记:
(12)
(13)
(14)
由最小二乘法可求得:
(15)
将式(12)、式(13)、式(14)、计算结果代入式(15),得到GM(0, N)灰色模型。采用灰色预测进行分析可以充分考虑样本因素的权重,结果准确性更高,一些学者对此进行了研究。张文泉 [14] 等从力学角度研究了底板采动破坏的主要影响因素,利用灰色理论获取了影响底板破坏深度各因素的关联度,在此基础上以线性与非线性方式对破坏深度进行拟合,得到了新的计算公式。路畅 [15] 等为确定底板破坏深度主要影响因素权重,采用灰色关联分析法对其进行了分析,结合具体工作面实测数据,建立了底板破坏深度的灰色预测模型。并基于工程实例对模型进行了验证。
2.4. BP神经网络
BP神经网络是由多层神经元组成的人工神经网络,其主要由三部分构成,分别为:输入层、输出层与隐含层。输入层用以接收初始数据;隐含层用以表示或存贮知识;输出层反馈出决策或预测结果 [16]。多层BP神经网络结构图如图3所示。
Figure 3. Structure of multilayer BP neural network
图3. 多层BP神经网络结构图
BP神经网络采用单向信号传递方式,即神经元信号仅向下层转递,同层神经元之间不相连,相邻层神经元之间有连接,以权重值表示其连接强度。每个神经元的状态均与一个作用函数f和阈值θ相对应,在输入层中,
,
;在隐含层和输出层中,
。
则隐含层和输出层的输出可以分别由式(16)和式(17)计算得出:
(16)
(17)
式中:
——隐含层第j个神经元对第k个样本的输出;n——输入层神经元个数;wji——输入层第i个神经元至隐含层第j个神经元的权值;
——第j个输入神经元对应于第k个样本的输入;θj——隐含层第j个神经元阈值;
——输出层第i个神经元对第k个样本的输出;p——隐含层神经元个数;vji——隐含层第j个神经元至输出层第t个神经元的权值;ri——输出层第i个神经元的阈值。
由式(18)可以计算输出误差平方和E来作为判断训练过程是否结束的标准。
(18)
式中:m——训练样本个数;q——输出神经元个数;
——第j个输出神经元对第k个样本的理想输出。
在误差逆向传播的过程中,校正误差由式(19)和式(20)求得。
(19)
(20)
式中:q——输出神经元个数;
,
——输出层第i个神经元相对于第k个输入样本的校正误差和输入值;
,
——隐含层第j个神经元相对于第k个输入样本的校正误差和输入值。
获得输出层和隐含层校正误差
和
之后,为获取最优结果,需要对相邻层之间的连接权值和阈值进行调整。其调整量可依据式(21)和式(22)计算:
(21)
(22)
式中:
,
——学习系数,且
,
,将修正后的权值和阈值重新带入模型即可得到最优化输出层结果。
BP神经网络是机器学习的经典算法之一,经实践证明具有较高的可行性与准确性。很多学者在使用BP神经网络进行底板破坏深度预测方面进行了研究,取得了大量的研究成果。于小鸽 [17] 依据典型煤矿突水案例,基于BP神经网络构建了底板破坏深度预测模型,并应用于工程实例,通对工程实测结果证实了模型的可靠性。郭文兵 [18] 对底板采动破坏深度影响因素进行了综合分析,并应用神经网络方法建立了底板破坏深度计算模型,对比分析了模型预测值、理论计算值和现场实测值。施龙青 [19] 等利用灰狼算法优化BP神经网络参数,建立PCA-GWO-BP神经网络模型预测煤层底板破坏深度,并与其他预测方法进行对比,结果证明该模型误差小、准确度高。
3. 结论
煤层底板破坏深度的准确确定目前仍是一个非常重要的研究课题,笔者在查阅研究大量资料的基础上,对使用统计学原理确定底板破坏深度的常用方法进行了阐述,得出如下结论:
1) 随着机器学习与大数据的兴起,使用统计学方法实现煤层底板破坏深度的预测已越来越成为一种重要手段。
2) 回归分析、支持向量机、灰色预测、BP神经网络是目前在底板破坏深度研究中最常用的几种统计学方法。目前,支持向量机和BP神经网络的应用较多,结果也较为准确,但计算步骤略为繁琐,回归分析、灰色预测应用较少,但计算简单,结果可靠度也较高。
3) 底板采动破坏深度的确定目前正朝着多元化,精细化,智能化方向发展,基于机器学习和大数据的多方法融合分析是未来底板破坏深度确定的必然趋势。
基金项目
安徽省教育厅2019年高校自然科学研究重大项目(KJ2019ZD11);国家自然科学基金面上项目(No. 41977253)。