1. 引言
岩石可钻性作为反映地层性质最全面的一种参数,是进行钻头选型和钻头结构设计时的重要依据[1],准确评价可钻性在动态调整钻进参数、地质分层、钻头选型等方面具有重要指导意义。可钻性评价的传统方法是采样获取地层岩心,再通过压入实验、微钻实验等直接测定可钻性级值,局限性在于取芯困难、成本高、影响正常钻进以及不能实时获取可钻性数据。数理分析方法以测井、录井数据为基础,通过回归分析拟合得到钻速方程等计算可钻性级值,不足之处在于各地区地层条件不同,其系数取值对结果影响极大,计算结果精度波动大[2]。
近年来,随着人工智能技术在各行各业的应用,利用机器学习预测可钻性的方法成为研究热点。马海等人[3]利用支持向量机(SVM)建模分析测井声波时差、地层密度、泥质质量分数等参数与可钻性的关系,结合粒子群算法(PSO)建立了PSO-SVM模型,对准噶尔盆地庄2井进行了可钻性预测。董青青[4]提出了一种粒子群算法(PSO)优化的BP网络预测地层可钻性的新模型(PSO-BP),该模型相较于传统的BP神经网络模型,其参数结构更合理,拟合精度、收敛速度均有所提高。杜宇等人[5]使用遗传算法(GA)优化神经网络结构,建立GA-BP神经网络模型,进一步提高了模型的精度。
BP神经网络具有较强的自适应性及非线性拟合能力等优点,有利于分析繁杂的实钻数据与可钻性之间的非线性联系[6],但其训练的初始权值、阈值和节点数都是随机生成的,可能导致结果陷入局部最优。因此,本文利用鲸鱼算法(WOA)优化BP神经网络(WOA-BP)实现可钻性预测,通过鲸鱼算法的自动寻优调整神经网络结构,从而优化模型性能、提高预测精度。
2. WOA-BP神经网络原理
2.1. 鲸鱼算法原理
座头鲸有特殊的捕猎方法,这种觅食行为被称为泡泡网觅食法;标准WOA模拟了座头鲸特有的搜索方法和围捕极值,主要包括:围捕猎物、气泡网捕食、搜索猎物三个重要阶段。WOA中每个座头鲸的位置代表一个潜在解,通过在空间中不断更新鲸鱼的位置,最终获得全局最优解[7]。
① 搜索猎物
为确保所有可能有解的空间均能被有效搜索,WOA算法通过不断更新鲸鱼个体和猎物之间的距离来确定位置,实现对全局的搜索。因此,当|A| ≥ 1时,负责搜索的鲸鱼会返回种群,位置更新如下:
(1)
(2)
式中:
——当前搜索个体与随机个体的距离;
——当前随机个体的位置。
② 围捕猎物
鲸鱼种群范围是全局搜索,首先确定猎物的移动位置。这一过程的原理:初步假设当前位置为靠近猎物的最优解位置,鲸鱼种群向这一假定的最优解位置靠近。这一行为的位置更新表示如下:
(3)
(4)
式中:X(t)——表示位置的向量;t——当前迭代次数;X*(t)——目前的最优解的位置更新;A、C——表示系数的向量。
③ 气泡网捕食和收缩包围
通常情况座头鲸通过气泡网捕食,座头鲸的移动与猎物移动的相对位置通过对数螺旋方程表达,位置更新如下:
(5)
(6)
式中:D'——当前的搜索个体与当前状态最优解的相对距离;l——值域范围
均匀分布的随机数;b——螺旋形状参数。
部分情况座头鲸会采用收缩捕食的方式,因此WOA算法根据随机概率p来确定气泡网捕食或是收缩包围,位置更新如下:
(7)
式中:p——捕食机制概率,值域为
的随机数。
迭代次数t会随时间增加而增加,参数A和收敛因子a会逐渐减小,若|A| < 1时,鲸鱼群会向着当前最优解围捕猎物,在WOA模型中表现为局部寻优过程。
WOA算法首先初始化定义全局位置,再随机初始化最优解,当系数|A| > 1时全局随机搜索代理,|A| < 1时选择最优解更新搜索代理位置[8]。通过每次围捕猎物确定最优解的位置是否合理,在迭代过程中将参数a有2逐渐迭代降为0 [9],根据系数p的值,WOA可以在螺旋捕食和气泡网捕食之间进行切换。最后,根据精度的要求,达到满足终止准则时终止WOA算法的寻优过程[10]。
2.2. 鲸鱼算法优化BP神经网络
鲸鱼在捕猎过程中采用包围猎物与环形游动喷出气泡网来驱赶猎物两种方式进行捕猎,而BP神经网络在每次训练时都会随机产生权值和阈值,权值和阈值的变化会对模型结构和训练结果产生决定性的影响[11]。因此,采用鲸鱼优化算法的寻优功能优化BP神经网络的权值和阈值,确保模型的结构参数合理,从而建立性能稳定的BP神经网络模型实现可钻性预测。鲸鱼算法与BP神经网络结合原理如图1所示。
Figure 1. WOA optimizes BP flow charts
图1. WOA优化BP流程图
3. 数据处理
为降低模型冗余,对井深、泥浆密度、扭矩钻压、转速、大钩载荷以及可钻性级值等数据依次进行数据清洗、小波滤波降噪和归一化处理,整理得到优质数据用于机器学习。
3.1. 数据清洗
由于钻井周期长、记录人员不同及记录统一标准等因素的影响,钻井数据可能出现异常错误、格式不统一、存在部分遗漏等问题,这些问题会严重影响机器学习的准确性[12]。通过删除法、均值插补、同类均值插补等方法对数据进行处理。残缺数据和无效数据可采用平均值代替,重复数据和异常数据可考虑适当删除或用平均值代替(图2),确保数据准确性,数据清洗结果如图3(b)所示。
Figure 2. Data cleaning process
图2. 数据清洗流程
3.2. 小波滤波降噪
小波变换具有局部化思想,同时克服了窗口大小不随频率变换的缺点,能够提供一个随信号改变的“时间 * 频率”窗口[13]。将分析信号X(t)作小波变换,即:
(8)
式中:a为尺度因子,切a > 0,实现对基本小波φ(t)进行伸缩变换;τ为平移因子,实现对基本小波在时间轴上的平移。
将初步清洗后的转速、钻压、大钩载荷、泥浆密度、声波时差、伽马等钻井参数降噪处理,结果如图3(c)所示。
Figure 3. Data processing results (taking hook load as an example, unit: kDaN)
图3. 数据处理结果(以大钩载荷为例,单位:kDaN)
3.3. 归一化处理
不同类别的数据量纲属性不同,为避免“较大”数据产生的波动掩盖“较小”数据的特征,模型训练输入参数需统一量纲[14]。常用Min-Max方法对参数进行归一化处理,原理如下:
(9)
式中:x'——数据归一化后的值;x——原始数据;xmax,xmin——原始数据中的最大值,最小值。
3.4. 参数相关性分析
在模型训练过程中,参数种类较多,各数据间相关性强弱不同,直接将各类参数作为模型输入,增加模型冗余,降低模型计算效率。为了简化模型输入,提高模型计算效率,对原始参数进行相关性分析,选取与可钻性相关性强的参数作为模型训练的输入参数。
利用皮尔逊积矩相关系数对CAL、MW、KD、WOB、RPM、SPP、HL、Torque、DP、FP、Q、GR、GAB、PG这14个参数进行相关性分析,如图4所示。结果表明,CAL、WOB、RPM、Torque、Q、GR共6个参数与可钻性(KD)相关性较强,相关性系数均大于0.2,故本次研究选取上述6个参数作为神经网络的输入参数。
Figure 4. KD and Pearson correlation thermal maps of major drilling parameters
图4. KD与主要钻井参数Pearson相关性热力图
4. WOA-BP可钻性预测建模
由上述相关性分析,将CAL、WOB、RPM、Torque、Q、GR共6个参数作为模型输入参数,模型的输出参数为本次的研究对象KD,构建含两个隐含层的BP神经网络(图5)。
Figure 5. BP neural network model structure
图5. BP神经网络模型结构
进一步使用WOA算法优化BP神经网络结构,训练初始参数如表1所示。初始化BP神经网络的权值和阈值;计算鲸鱼优化算法WOA的决策变量长度,选取均方误差作为优化的目标函数[15];将BP神经网络的权值和阈值参数作为WOA算法的决策变量,以均方误差作为优化的目标函数,通过WOA算法进行优化,迭代次数达到一定阈值或者目标函数值收敛到一定程度时停止算法;将WOA算法优化得到的权值和阈值参数赋值到BP神经网络中;优化后的BP神经网络训练与测试,与优化前的BP神经网络以及遗传算法(GA)优化的BP神经网络(GA-BP)进行精度对比。结果表明:BP模型、GA-BP模型、WOA-BP模型的训练精度依次为0.901、0.915、0.931 (图6),WOA-BP模型的训练精度最高,其测试集拟合精度达到0.928,拟合效果较好。
Table 1. WOA-BP model parameters
表1. WOA-BP模型参数
训练次数 |
学习速率 |
最小误差 |
动量因子 |
初始化种群规模 |
最大进化代数 |
1000 |
0.01 |
0.0001 |
0.01 |
30 |
50 |
5. 现场应用
研究地区位于北美DON区块,该区块主要进行超长水平井页岩油气开发。其地质层系为三叠系、白垩系、侏罗系和泥盆系,岩性分布页岩、灰岩和白云岩为主,地质条件较为复杂,岩性变化大。本次研究所获取的数据包括钻井设计报告、测井数据、录井数据和钻井日报等,由相关性分析可知,选取模型的输入参数为CAL、WOB、RPM、Torque、Q、GR共6个参数,部分数据整理如表2所示。利用BP模型、GA-BP模型、WOA-BP模型对邻井可钻性进行预测,结果如图7所示。结果表明:总体上定性分析可知,各模型预测结果相较于实际值均偏低,其中未优化的BP模型预测值波动明显,误差最大;遗传算法优化的GA-BP模型波动较小,但部分预测点偏离实际值较多;鲸鱼算法优化的WOA-BP模型结果稳定,最接近实际值,表现出较好的预测效果。
Figure 6. Training set fitting accuracy
图6. 训练集拟合精度
Table 2. 06-09-063-21 well data (part)
表2. 06-09-063-21井数据(部分)
MD (m) |
CAL (mm) |
WOB (kDaN) |
RPM (r/min) |
Torque (N/m) |
Q (m3/min) |
GR (api) |
1000 |
222 |
15.7 |
71 |
9500 |
2.6 |
67.9 |
1100 |
222 |
15.3 |
71 |
9500 |
2.6 |
149.1 |
1200 |
222 |
5.9 |
71 |
9500 |
2.61 |
100.8 |
1300 |
222 |
10.1 |
41 |
9500 |
2.6 |
114.8 |
续表
1400 |
222 |
14 |
70 |
9600 |
2.6 |
149.1 |
1500 |
222 |
15.5 |
71 |
9600 |
2.59 |
145.5 |
1600 |
222 |
4.7 |
2 |
9600 |
2.6 |
136.6 |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
4800 |
171 |
13.9 |
100 |
12,500 |
1.2 |
166.1 |
4900 |
171 |
12 |
100 |
12,500 |
1.2 |
165.3 |
5000 |
171 |
12.3 |
100 |
12,500 |
1.2 |
152.6 |
Figure 7. Comparison between real and predicted drillability values of 3200~3300 m in DON oilfield
图7. DON油田3200~3300 m可钻性真实值与预测值对比
Figure 8. Distribution of absolute percentage error (APE) between predicted and true drillability
图8. 可钻性预测值与真实值绝对百分比误差(APE)分布图
对预测结果进行定量分析。将模型预测的结果与ROP真实值进行误差分析,计算绝对百分比误差(APE),如图8所示。结果表明:总体上看,使用优化算法能明显提高ROP预测精度,误差小于10%的数据占比相较于传统的BP模型有较大提高;对比三种优化算法模型可知,WOA-BP模型表现出的预测精度最高,误差小于10%的数据占比为75.38%,相较于BP模型、GA-BP模型分别提高13.1%和4.86%。
6. 结论
收集整理测井数据和录井数据,进行数据清洗、降噪、归一化处理及相关性分析,优选与可钻性相关性强的参数作为训练参数;采用WOA-BP神经网络建模预测可钻性,并和BP模型、GA-BP模型对比分析。结论如下:
(1) 利用Pearson积矩相关系数对CAL、ROP、SPP等14个参数进行相关性分析,结果表明:CAL、RPM、Torque、Q、GR、WOB共6个参数与可钻性相关性较强,作为神经网络模型的输入参数。
(2) 模型训练精度:BP模型、GA-BP模型、WOA-BP模型的训练精度依次为0.901、0.915、0.931,WOA-BP模型的训练精度最高。
(3) 现场应用表明,鲸鱼算法优化的WOA-BP模型结果稳定,预测得到的可钻性级值最接近实际值,WOA-BP模型表现出的预测精度最高,误差小于10%的数据占比为75.38%,相较于BP模型、GA-BP模型分别提高13.1%和4.86%。
基金项目
全国大学生科技创新项目(项目编号:202311551014)。
NOTES
*通讯作者。