1. 引言
青鱼(Mylopharyngodon piceus)、草鱼(Ctenopharyngodon idellus)、鲢鱼(Hypophthalmichthys molitrix)、鳙鱼(Aristichthys mobilis),俗称“四大家鱼”,是我国主要的淡水养殖和捕捞对象,在淡水渔业中占有很大的比例。汉江是我国著名的四大家鱼天然产卵场的分布区之一 [1]。而丹江口水库是汉江上主要的水利枢纽,为配合南水北调中线工程的实施,水库正常需水位从原有的157 m升高到170 m,进一步加大了对汉江中下游水文情势的影响,改变汉江现有的生态环境,对鱼类的生活产生复杂的影响,特别是对四大家鱼的影响更大 [2] [3]。
目前,对四大家鱼产卵的研究中,李翀等 [4] 分析了1970年前后宜昌站水文情势变化,指出产卵场所处江段5~6月的总涨水日数是决定四大家鱼苗发江量多寡的重要因子;王尚玉 [5] 等采用一维水动力模型MIKE11模拟了长江中游宜昌至汉口1997~2006年的日流量和水位数据,获取每年4月22日~7月20日涨水过程数、总涨水日数等9项因子的统计参数,并对其进行分析,结果表明选取的9项生态水文指标是四大家鱼产卵的必要条件,而非充分条件。张晓敏 [6] 等采用系统重构分析的方法将洪水分成9项不同要素,模拟四大家鱼繁殖所需的水文条件,研究表明,洪峰初始水位、洪峰最高水位,上涨持续时间等因素都会对四大家鱼产卵产生影响。另外,根据已有研究和实际观察资料,四大家鱼产卵所需的最低水温为18℃,低于该温度从未见过产卵,且四大家鱼产卵期通常为4月下旬至7月下旬,此时汉江水温均高于18℃,故本文不考虑水温的影响。
和上述研究一样,一些研究 [7] [8] 虽采用不同的方法研究影响四大家鱼产卵的因素,但最终得到的因子均过多,对水库等水利枢纽生态调度的指导意义有限。为进一步了解四大家鱼产卵所需的关键生态水文因子,在前人已有的研究基础上,本文选取汉江四大家鱼产卵事件和对应洪水过程特征资料,采用主成分分析法进行分析,得出影响四大家鱼产卵的主要因子,为河流水利工程的生态调度研究提供参考。
2. 主成分分析(PCA)简介
本主成分分析法(Principal Component Analysis)简称PCA,是将高维变量空间进行降维处理的一种方法。在保证原始数据信息损失最小的前提下,经过线性变换和舍弃部分信息,以少数综合变量取代原有多维变量,使较少的综合指标既能尽量多地反映原来变量指标信息,同时它们之间又是相互独立的。根据PCA基本原理。一般的计算过程如下 [9]。
1) 建立n个样本p个指标的原始数据矩阵
,对其进行无量纲化或标准化处理。通常采用z-score法无量纲化,得到矩阵计算公式为:
(1)
其中:
。
2) 计算指标相关系数矩阵
,其计算公式为:
(2)
式中:R为实对称矩阵,只需计算上三角元素或下三角元素即可。
3) 根据特征方程
,求特征向量
,并对进行排序,即
;再分别求对应于
的特征向量
,这里要求
,即
,表示向量ei的第j个分量。
4) 计算各主成分的贡献率及累计贡献率。贡献率为:
(3)
累计贡献率计为:
(4)
一般取累计贡献率达85%~95%的特征值
所对应的m (m ≤ p)个主成分。
5) 计算原变量在各主成分上的载荷矩阵:
(5)
6) 计算各主成分的得分矩阵:
(6)
7) 多指标加权综合评价模型:
(7)
式中:wj为权值,可以按各主成分的贡献率来确定。可以将式(7)定义成综合主成分得分,它反映综合发展水平。
3. 数据来源
3.1. 研究对象
选取丹江口水库下游沙洋站水文及鱼类数据为研究对象。丹江口水库是一个峡谷盆地交替型的水库,控制流域面积9.52万km2,坝高162 m,正常蓄水位157 m,相应库容174.5亿m3。2006年9月,丹江口水库大坝加高工程开始实施,从高程162.0 m加高到176.6 m,加高14.6 m,加高后正常蓄水位为170 m,相应库容290.5亿rn3,属不完全多年调节水库。沙洋站位于丹江口水库下游,其地理位置如图1所示。
3.2. PCA因子
根据前面分析和现有水文资料,从水温、涨水过程数、涨水持续时间、断面初始流量、流量的日增长率、洪峰的初始水位、水位的日上涨率、前后两个洪峰过程的间隔时间、洪峰水位上涨持续时间、前后两个洪峰过程的水位差异、起始产卵日期、苗汛时序等水文指标中选取水位上涨持续时间、洪峰初始水位、洪峰最高水位、水位日上涨率,水位上涨幅度、洪峰初始流量、洪峰最高流量、流量日上涨率8项水文指标进行PCA分析。各指标的含义如表1所示。选取历年四大家鱼产卵时对应的生态洪水过程特征如表2。
![](//html.hanspub.org/file/12-2411010x28_hanspub.png)
Figure 1. Distribution of spawning grounds of four major Chinese carps in the middle and lower reaches of Hanjiang River
图1. 汉江中下游“四大家鱼”产卵场分布示意图
![](Images/Table_Tmp.jpg)
Table 1. Calculation method of eco hydrological index for natural reproduction of four major Chinese carps
表1. 四大家鱼自然繁殖生态水文指标计算方法
![](Images/Table_Tmp.jpg)
Table 2. Characteristics of flood process during spawning of four major Chinese carps in Shayang station
表2. 沙洋站四大家鱼产卵时洪水过程特征
4. 结果及分析
根据四大家鱼产卵事件和对应洪水过程特征,建立统计分析数据库。根据主成分分析法,先对原始数据进行无量纲处理,再求相关系数矩阵,由相关系数矩阵计算特征值。相关系数矩阵结果见表3。
相关系数矩阵(表3)中大部分相关系数均大于0.25,即显示选取的8个指标之间的相关程度较高,说明参数之间存在信息重叠,适合用主成分分析法进行分析。
![](Images/Table_Tmp.jpg)
Table 4. Variance decomposition principal component extraction analysis table
表4. 方差分解主成分提取分析表
计算各主成分特征根及累计贡献,其结果如表4。按照特征根大于1的原则,使用主成分分析法提取3个主成分,其累计贡献率为97.402%,三因子对原有变量信息包含程度很高,因此,选取的三个主成分Z1,Z2,Z3能够充分反映上述8项指标的信息。然后计算主成分载荷,结果见表5。
![](Images/Table_Tmp.jpg)
Table 5. Principal component load matrix
表5. 主成分载荷矩阵
从表5中可知:第一主成分与水位日上涨率、上涨幅度、流量日上涨率3个指标呈负相关,与其他5个指标正相关,且第一主成分在洪峰初始水位、洪峰最高水位、洪峰初始流量、洪峰最高流量上的载荷比较大(0.904~0.982),说明第一主成分在一定程度上就能反映四大家鱼产卵所需洪水的主要特征;第二主成分在水位日上涨率、流量日上涨率上的载荷较大,且正相关;第三主成分在上涨幅度上的载荷较大,达到0.835。由主成分载荷矩阵作进一步处理,可得主成分方差与方差贡献,如表6所示。
![](Images/Table_Tmp.jpg)
Table 6. Principal component variance and variance contribution
表6. 主成分方差与方差贡献
综合已有四大家鱼产卵研究与主成分定义和3个主成分的线性组合,汉江四大家鱼产卵的主要生态水文因子为:洪峰初始水位、洪峰初始流量、流量日上涨率、上涨幅度。由此原来的8项指标减少到4项,在一定的程度上简化生态调度时需要注意的调控因子。
5. 结论
主成分分析法在保证原始数据信息损失最小的前提下,经过线性变化和舍弃部分信息,以少数的综合变量取代原有多维变量,简化了数据结构,使结果客观合理,可以避免依据主观评价确定指标权重的不准确性。本文在已有四大家鱼产卵研究的背景下,运用主成分分析法对影响四大家鱼产卵的洪水过程特征的指标进行简化处理,得出四大家鱼产卵所需的生态洪水过程的关键调控指标(洪峰初始水位、洪峰初始流量、流量日上涨率、上涨幅度),为水库的调度和保证四大家鱼的产卵水文过程提供理论依据。本文不足之处在于所得鱼类产卵数据有限,需要更加详细的资料进行对相关结论进行验证。