基于主成分分析的Fisher判别分析法开展杂卤石识别研究

doi:10.12677/AG.2018.82043

期刊菜单

基于主成分分析的Fisher判别分析法开展杂卤石识别研究
Based on the Principal Component Analysis and Fisher Discriminant Analysis to Identify the Polyhalite

DOI: 10.12677/AG.2018.82043, PDF, HTML, XML, 国家自然科学基金支持
作者: 张萌^*, 葛奕杉, 李万潇, 江永康, 龚宇坤, 闵鑫林：西南石油大学地球科学与技术学院，四川成都；王昆：中石化南方勘探公司勘探开发研究院，四川成都
关键词: 固态钾盐；杂卤石；四川盆地；Fisher判别法；交会图法；Solid Potassium Salt； Polyhalite； The Sichuan Basin； Fisher Discrimination； Cross Plot Method

摘要: 四川盆地下中三叠系海相钾盐广泛分布，主要发育的固态钾盐——杂卤石多与石盐、硬石膏、岩盐等矿物共生，岩性十分复杂。因此，准确识别出杂卤石就显得十分重要。笔者以测井方法理论和数学统计理论为基础，结合主成分分析方法，建立fisher判别模型开展研究区岩石矿物定性识别研究，整体的判别正确率达到了82.9%，效果明显。与传统测井识别方法——交会图法相比具有识别准确率高、操作简单、识别速度较快等特点，值得进行推广使用。

Abstract: The potassium salt of the lower Triassic in the Sichuan Basin is widely distributed. The main de-velopment of polyhalite is associated with minerals such as rock salt, anhydrite and rock salt, and the lithology is very complicated. Therefore, it is very important to accurately identify the polyhalite in the Sichuan Basin. Based on well logging method theory and mathematical statistics theory, the author combined the principal component analysis method to establish a fisher discriminant model to carry out qualitative identification of rock minerals in the study area. The overall discriminant accuracy rate reached 82.9%. Compared with the traditional logging identification method—cross plotting method, it has the characteristics of high recognition accuracy, simple operation, and high recognition speed. So, it is worthy of promotion and using.

文章引用：张萌, 葛奕杉, 李万潇, 王昆, 江永康, 龚宇坤, 闵鑫林. 基于主成分分析的Fisher判别分析法开展杂卤石识别研究[J]. 地球科学前沿, 2018, 8(2): 406-415. https://doi.org/10.12677/AG.2018.82043

1. 引言

中国是一个传统农业大国，对钾肥的需求量非常大，钾盐是制作钾肥的重要原材料之一同时也是重要的工业原料，中国非常短缺，主要原因是钾盐资源的勘探不明。四川盆地下中三叠统嘉陵江组和雷口坡组广泛发育难溶性固态钾盐——杂卤石(K₂SO₄∙MgSO₄∙2CaSO₄∙2H₂O)是制造钾肥的原料之一。1991年发现的农乐杂卤石矿床表明四川盆地三叠纪钾盐具有良好的勘探开发前景。因此，加大四川盆地海相钾盐的勘探开发力度有助于缓解我国钾肥缺乏的困境，提供重要的工业原材料。地球物理测井方法具有纵向速率高，解释精确、快速的特点，是我国主要用以识别划分固态钾盐的主要方法之一。2014年，陈科贵、李利等人归纳总结了四川盆地南充盐盆固态钾盐的测井响应特征并对南充盐盆盐岩层位进行了重新梳理 [1] ；2014年，陈科贵、李春梅等提出了用交会图法来识别固态钾盐矿物 [2] 。但是传统测井方法识别过于依赖个人主观因素，速度也慢，识别误差较大，很难对杂卤石进行精确的划分和区别。2016年，陈科贵等将模式识别法引入到钾盐领域 [3] [4] ，建立BP神经网络模型和支持向量机模型开展杂卤石层识别，识别正确率达80%以上，效果良好；2017年，陈科贵、李进等人提出了改进的支持向量机杂卤石识别法 [5] ，也取得了不错的效果。

判别分析是在分类确定的条件下，根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法，目前在气候分类、农业区划、土地类型划分等方面有着广泛的应用。笔者将判别分析中的Fisher判别法引入到钾盐勘探领域，以测井理论和数学统计理论为基础，开展固态钾盐杂卤石的识别与储层的划分。Fisher判别分析法相对于传统测井识别法具有操作简单，识别速度快，样本数据要求低等优点，并且可以有效地减小人为因素引起的误差，提高识别精度和速率。为了进一步提高固态钾盐岩性划分的精度，我们基于前人的研究经验，提出了主成分分析——Fisher判别方法识别杂卤石。研究表明，该方法相对于传统测井识别法具有更广阔的勘探应用前景。

2. 研究区概况

川中地区位于四川盆地川西凹陷带中东部，构造上为一次级凹陷 [6] 。四川盆地三叠纪地层钾盐矿物广泛分布，岩性复杂，主要的钾盐矿物有杂卤石、无水钾镁矾、硫锶钾石，钾石膏等。研究区是四川盆地盐类沉积最广的次级盐盆，主要含盐构造有广安构造、南充构造、合川大石桥构渠县鲜度构造及大英构造。川中三叠系地层钾盐沉积受苏皖运动和印支运动的影响，在海退期沉积石膏、杂卤石等蒸发岩类，其中杂卤石在广安构造地区和龙女寺构造地区沉积情况较好 [7] 。但是川中地区的杂卤石多与其他岩石矿物互存 [8] [9] ，常伴随有硬石膏、岩盐、泥岩、碳酸盐岩等矿物发育，传统的测井方法很难判别区分杂卤石。

3. 杂卤石测井响应特征

四川盆地的发育的固态钾盐主要为杂卤石 [10] [11] ，杂卤石隶属高电阻率难溶含钾矿物，含有结晶水，密度(DEN)高值的区间为2.72~2.78 g/cm³。常规的杂卤石测井响应特征为：自然伽马(GR)相对较高；声波时差(AC)一般为55~95 us/ft，高补偿中子(CNL)相对高值。在沉积作用下，四川盆地的杂卤石分布于石膏、硬石膏和盐岩之中，形态主要有层状、浸染状、团块状、星点浸染状或板块状四种。因杂卤石含有大量的K，故在自然伽马测井能谱曲线上，杂卤石层的响应是非常明显的，反映为高K，低Th和U。因为研究区的地层条件，杂卤石层中杂卤石与石膏互相黏连，且还有别的黏土矿物的存在，种类多含量大，给杂卤石的区分造成了不便。因此，笔者以钾盐矿物的测井响应特征为基础，测井解释方法原理和数学统计理论为指导，开展交会图法和PCA-Fisher判别分析法钾盐矿物定性识别研究，最后用准确的岩心分析资料验证识别结果，比较两种方法的优缺点。

4. 杂卤石交会图识别标志

交会图法是一种常用的岩性识别技术。将两种或多种数据在平面图上交会，根据其交会点的坐标可以比较大致地定出岩性变化的范围。在地球物理测井方法中，经常用五条常规测井曲线——自然伽马(GR)、中子密度(CNL)、声波时差(AC)、密度(DEN)、深侧向电阻率(RLLD)来反映岩性的变化。杂卤石具有放射性，自然伽马及自然伽马能谱测井信息是识别其最有效的信息之一，而电阻率曲线，孔隙度曲线又能很好的分辨泥岩及其他蒸发岩。考虑到不同岩性的电性特征存在差异，因此我们建立了深侧向电阻率(RLLD)和三孔隙度(AC、DEN、CNL)、自然伽马(GR)的曲线交会图，开展研究区固态钾盐矿物的识别。(图1)。

通过分析对比图中杂卤石与泥岩层各方面特性，可以看到杂卤石声波时差相对较小，密度较大；而泥岩层声波时差相对较大，密度较小。因此识别杂卤石的重叠图中，杂卤石出现幅度差的差异越大，就代表杂卤石越纯。使用交会图法可以较好的区分出岩盐，绿豆岩和杂卤石。但是对于泥质杂卤石，膏质杂卤石，杂卤石膏岩不是很好识别，主要是因为杂卤石的含量不高，岩性分界线很难划分。交会图对于大部分岩性都能进行大致的区分，但是很多岩性重叠，且容易受到主观因素的影响，使区分难度大大增加。

5. PCA-Fisher判别分析法

Fisher判别分析的基本思想是通过投影，使得总体在所有多维空间的样本点投影到一维空间上。对于投影的要求是不同分类的组与组之间类间离差尽可能大，同类分组的类内离差尽可能小，然后利用方差分析的方法推导出判别函数，此次研究我们使用的是线性判别函数。

5.1. PCA主成分分析原理

主成分分析是一种统计分析方法，核心思想是找出几个彼此之间互不相关的综合变量在力求数据信息丢失最少的原则下，对高维变量空间进行降维，使这些综合变量能够尽可能地代表原来变量的信息量。

Figure 1. Rendezvous method for identifying rock minerals

图1. 交会图法识别岩石矿物。(a) CNL与RLLD交会图；(b) AC与RLLD交会图；(c) DEN与RLLD交会图；(d) GR与RLLD交会图

假设 $X_{1}, X_{2}, \dots, X_{p}$ 为原变量， $Z_{1}, Z_{2}, \dots, Z_{p}$ 为新变量，做线性组合为 $Z = A X$ ，主成分分析数学模型为 [12] [13] [14] ：

${\begin{cases} Z_{1} = a_{11} x_{1} + a_{12} x_{2} + \dots + a_{1 p} x_{p} \\ Z_{2} = a_{21} x_{1} + a_{22} x_{2} + \dots + a_{2 p} x_{p} \\ ⋮ \\ Z_{p} = a_{p 1} x_{1} + a_{p 2} x_{2} + \dots + a_{p p} x_{p} \end{cases}$

其中： $Z_{i}$ 和 $Z_{j}$ ( $i \neq j; i, j = 1, 2 \dots, p$ )相互无关；；是的一切线性组合中方差最大者；是与不相关的所有的所有线性组合中方差最大者；……；是与不相关的的所有线性组合中方差最大者。

主成分的求解主要就是确定()在主成分 ()上的系数，计算过程如下：

1) 计算相关系数矩阵， ()为原变量和的相关系数。

2) 解特征方程，求出特征值，并按从大到小排列；分别求出对应特征值的特征向量使。

3) 计算第k个主成分的贡献率，主成分()的累计贡献率。如果m个成分的累计贡献率≥80%，则说明m个成分包含了p个成分的大部分信息，则主成分的个数就为m。

5.2. Fisher判别分析求解方法

设有m个样本，每个样本都有个指标。而样本的均值常量分别为。所以从样本中抽出n_i的样本，所以可以得到 [15] [16] ：

设判别函数为：。

计算组内样本均值和总样本均值，并且分别求出组内差e与组间差b。

(E为组内离差平方和)

(B为组间离差平方

为了使离差比λ达到最大，所以要使得e的值趋近于1，所以即成立为一个在c^TEc=1的条件下，使得c^TBc的取得最大值的问题。

根据极值存在条件，在有约束的条件下，运用拉格朗日乘子法，令，可求得进一步对其整理可以得出，λ和c分别为的最大特征值和对应的特征向量，从而求出判别函数。

6. 建立PCA-Fisher判别分析模型

PCA-Fisher判别分析模型是通过建立数学分析的模型进行岩性划分。首先以测井响应中的主要相关变量GR、CNL、AC、CAL、DEN、Rt和自然伽马能谱中Th、K、U的测井曲线作为输入进行PCA主成份分析，找到可以代替原变量的主变量。然后以筛选出的主变量测井曲线值作为输入建立Fisher判别分析模型开展研究区钾盐层段岩性识别。最后，以准确的录井结果验证模型的性能，并改进模型(表1)。

6.1. 测井数据归一化

为了有效的避免数据量纲和量纲单位对实验数据的影响，我们对上述数据进行归一化处理，使得数据处于在同一个数量等级测试。我们发现GR，AC，CNL，DEN，U，Th，K测井曲线做线性归一化，Rt曲线做对数归一化最为合适，图2为Rt曲线线性归一化和对数归一化对比图。

6.2. 建立PCA分析模型

用SPSS软件处理归一化后的测井数据，求出样本数据的特征值、方差贡献率和累积方差贡献率。表2为变量的方差分析表。

通过分析上述表格可得出中子密度(CNL)、声波(AC)、密度(DEN)、自然伽马(GR)和深浅双侧向电阻率(Rt)五个主成份变量对于结果的累计贡献率影响最大，达到了89.993%，基本包含了大部分的信息变量，

Table 1. Part of the learning sample

表1. 为部分学习样本

Figure 2. Linear normalization and logarithmic normalization comparison diagram

图2. 线性归一化和对数归一化对比图

Table 2. Variance analysis table

表2. 变量方差分析表

Table 3. Part of the sample main component score

表3. 部分样本主成分得分

因此我们可以以这五个作为输入建立fisher判别分析模型(表3)。

6.3. 建立Fisher分析判别模型

首先根据岩心，薄片，录井资料，我们在川中研究区优选了120个测试样本。样本的选取原则：尽量不选择岩层较薄和岩层界点附近的样品，这些地方的样品受到围岩和其他方面的影响较大，对于岩石指示并不明显。通过对变量的主成分分析发现CNL、AC、DEN、GR和Rt五个主成份变量的方差累积贡献率达到了89.99%，这5个主变量的测井信息可以较好的反映岩性变化。在判别的过程中，需要对测井数据进行归一化预处理，即通过变换处理将数据的输入和输出限制在[0，1]的区间内。大多数测井曲线如GR、AC、DEN和CNL进行线性归一化即可，但Rt为非线性对数曲线，需要先进行对数变换。从交会图可以看出绿豆岩、石盐的测井曲线差异较大，利用Fisher判别时为了减少分类数量，仅对难区分其他5种岩性进行判别。选择研究区的学习样品，经过典则判别函数对样品进行投影，建立的典则判别函数F1、F2：

从建立的典则判别函数交会图3上可以看出该方法能较好的将几种岩性分开，特别是白云岩、石膏等岩性，表明该方法具有较好的岩性识别能力。

判别过程中，需要建立分类判别函数，表达式如下：

f1、f2、f3、f4、f5是fisher判别分析法得到的岩性概率函数。分别对应杂卤石(1)、石膏(2)、白云岩(3)、膏质杂卤石(4)、杂卤石膏岩(5)。将建立的模型样本带入上述岩性概率函数中计算，得到的f值与所对应岩石类型进行比对，得出岩性判断结果。通过对120个测试样本进行测试(见表4)，发现杂卤石的判别率达到了88.9%，膏质杂卤石

Figure 3. Canonical function rendezvous

图3. 典则函数交会图

Table 4. Discriminant results

表4. 判别结果

和杂卤石膏岩的判别性较差，但是整体的判别正确率达到了82.9%，准确率较高。

以研究区富集有杂卤石的X井为例，将建立的fisher判别模型进行实际应用，开展研究区杂卤石的定性识别(如图4)，并与录井结果进行对比，评价模型的性能。从图上可以看出，Fisher法识别杂卤石与录井结果符合度较高，模型性能较好，但是在岩石交界面处仍然有较大的误差。这是因为岩石交界面处杂卤石多于其他岩石矿物相结合，岩性复杂，导致识别准确率降低。

7. 结论

1) 通过交会图法的研究和分析，我们发现交会图法虽然简单明了，但是其岩性判断图形重合，不明显，导致识别难度较大，速度较慢，如果将多种岩性一起进行识别，判断的正确率就会大大降低。

2) Fisher判别法不受人为因素的影响，具有方法简单，可操作性强等优点，可直接利用测井解释软件进行自动解释，判别速度较快，准确率较高。以主成分分析处理后的测井数据为基础，数学统计理论为指导，建立Fisher判别分析模型开展研究区的钾盐层段定性识别，整体的判别正确率达到了82.9%，准确率较高。

3) 和交会图法相比，Fisher判别分析模型识别正确率和识别速度都有了较大的提高，更加适用于在

Figure 4. Interpretation example

图4. 解释实例

复杂的岩层中寻找杂卤石等含钾矿物，所以该方法有较高的应用价值。

基金项目

国家自然科学基金项目“四川盆地油钾兼探的地球物理评价方法研究”，编号“41372103”和“国家重点研发计划课题”，编号“2017YFC0602804”联合资助。

NOTES

^*通讯作者。

参考文献

[1]	陈科贵, 李利, 王刚, 等. 四川盆地南充盐盆下、中三叠统测井响应特征及成钾条件分析[J]. 矿床地质, 2014, 33(5): 1069-1080.
[2]	陈科贵, 李春梅, 李利, 等. 四川盆地含钾地层的地球物理测井标志、判别模型与应用——以川中广安地区为例[J]. 地球学报, 2013, 34(5): 623-630.
[3]	陈科贵, 刘利, 陈愿愿, 等. BP神经网络在钻孔测井资料分类识别杂卤石中的研究[J]. 中国石油大学学报(自然科学版), 2016, 33(4): 66-72.
[4]	陈科贵, 吴刘磊, 陈愿愿, 王刚. 基于支持向量机的川中杂卤石分类识别研究[J]. 地球科学进展, 2016, 31(10): 1041-1046.
[5]	陈科贵, 李进, 陈愿愿, 王刚. 基于主成分分析的极限学习机方法开展杂卤石识别[J]. 盐湖研究, 2017, 25(4): 8-13.
[6]	林耀庭, 陈绍兰. 论四川盆地下、中三叠统蒸发岩的生成模式、成盐机理及找钾展望[J]. 盐湖研究, 2008, 16(3): 1-10.
[7]	蒲杰, 吴霞, 李航. 四川盆地固态钾盐测井方法研究[J]. 石油工业计算机应用, 2013, 21(1): 31-34.
[8]	龚大兴. 四川盆地三叠纪成盐环境、成钾条件及成因机制[D]: [博士学位论文]. 成都: 成都理工大学, 2016.
[9]	林耀庭, 何金权. 四川省岩盐矿产资源研究[J]. 四川地质学报, 2003, 23(3): 154-159.
[10]	黄建国. 中国三叠纪钾盐沉积——以四川为例[J]. 岩相古地理, 1998, 18(4): 23-43.
[11]	林耀庭, 唐庆, 吴必豪, 刘群. 解决我国钾矿资源对策的新思路[J]. 地质地球化学, 1998(1): 81-85.
[12]	李连香, 许迪, 程先军, 李晓琴, 余和俊. 基于分层构权主成分分析的皖北地下水水质评价研究[J]. 资源科学, 2015, 37(1): 61-67.
[13]	张宁, 任茂文, 刘萍. 基于主成分分析和BP神经网络的煤岩界面识别[J]. 工矿自动化, 2013, 39(4): 55-58.
[14]	张莹, 潘保芝. 基于主成分分析的SOM神经网络在火山岩岩性识别中的应用[J]. 测井技术, 2009, 33(6): 550-554.
[15]	江雅勤, 田亚坤, 张志军, 汪敏, 张振园. 基于Fisher判别理论的尾矿库安全评价模型[J]. 工业安全与环保, 2017, 43(1): 47-50.
[16]	张紫昭, 陈凯, 程文瑜, 刘军, 田忠锋. 基于Fisher判别分析法的井巷围岩质量分类研究[J]. 煤炭科学技术, 2016, 44(11): 36-41.

为你推荐

友情链接