基于多项式回归算法的电量水量转换模型构建——以宁夏西干渠管理处马场滩灌溉站为例
Construction of Electricity-Water Conversion Model Based on Polynomial Regression Algorithm—A Case Study of the Machangtan Irrigation Station of Ningxia West Main Canal Management Office
DOI: 10.12677/AAM.2022.116342, PDF, HTML, XML, 下载: 385  浏览: 544 
作者: 陈建国:宁夏水利电力工程学校,宁夏 银川;俞 武, 马 军:宁夏西干渠管理处,宁夏 银川
关键词: 电量水量转换模型高阶多项式回归宁夏西干渠农业用水计量Electricity-Water Conversion Model Higher Order Polynomial Regression Ningxia West Main Canal Measurement of Agricultural Water
摘要: 我国农业水价综合改革背景下,严格灌区农业灌溉用水计量,针对各分散灌溉站存在设备陈旧、测量水量成本高、点多面广等问题,急需大规模、低成本、全覆盖的灌溉站水量测量方案。本文采用电流间接测量灌溉站实时灌溉用水量,以宁夏西干渠管理处马场滩灌溉站为例,借助超声波流量计来获取灌溉站电流和水量等历史数据,采用多项式回归算法,构建灌溉站电量水量转换模型,通过验证模型预测的绝对值误差为0.0092,表明构建的模型具有较好的鲁棒性和稳定性,能够实现较为准确地计算灌溉站的用水量,该模型集成到马场滩灌溉水量检测平台中,具有在线动态计算水量、确准度较高、成本低、易于实施等特征,有效满足农业灌溉用水计量的要求,具有较好推广应用价值。
Abstract: Under the background of the comprehensive reform of agricultural water price in my country, the measurement of agricultural irrigation water in irrigation areas is strictly required. In view of the problems of outdated equipment, high water measurement cost, and wide range of points in each decentralized irrigation station, a large-scale, low-cost, and full-coverage irrigation station water measurement solution is urgently needed. In this paper, the current indirectly measures the re-al-time irrigation water consumption of the irrigation station. Taking the Machangtan irrigation station of Ningxia West Main Canal Management Office as an example, the ultrasonic flowmeter is used to obtain historical data such as the current and water volume of the irrigation station, and the polynomial regression algorithm is used to construct the electricity and water volume of the irriga-tion station. Converting the model, by verifying that the absolute value error of the model predic-tion is 0.0092, it shows that the constructed model has good robustness and stability, and can cal-culate the water consumption of the irrigation station more accurately. The platform has the char-acteristics of online dynamic calculation of water volume, high accuracy, low cost, and easy imple-mentation, which can effectively meet the requirements of agricultural irrigation water metering, and has good application value.
文章引用:陈建国, 俞武, 马军. 基于多项式回归算法的电量水量转换模型构建——以宁夏西干渠管理处马场滩灌溉站为例[J]. 应用数学进展, 2022, 11(6): 3230-3238. https://doi.org/10.12677/AAM.2022.116342

1. 引言

水资源不仅是一种自然资源,还是一种经济资源,在生态环境和社会发展中具有重要作用。我国是农业大国,农业用水始终占比较大,根据我国水资源公报中统计,2020年全国用水总量为5812.9亿立方米,其中农业用水3612.4亿立方米,约占总量的62.1%,是我国用水的主要领域。合理利用农业水资源,能够有效实现水资源的节约与保护。但是随着人口、社会经济的快速发展,人们对粮食的需求不断增加,水资源供需矛盾日益突出,提高农业用水利用效率迫在眉睫 [1] [2]。与此同时,在农业灌溉用水方面,目前利用率也相对较低,水资源浪费现象较为严重 [3] [4]。因此为提高我国农业用水效率,减少农业用水总量,同时缓解我国水资源不断减少的问题,2016年国务院发布《关于推进农业水价综合改革的意见》,推进农业改革工作,促进我国农业领域的可持续发展。2021年国家发展改革委根据改革进程,安排“十四五”时期改革任务,印发《关于深入推进农业水价综合改革的通知》。其中将用水计量到位看作为改革验收的必备条件,并在因地制宜推进重点任务落地见效中,明确了大中型灌区的计量改革工作内容,加强对农业灌溉用水计量工作逐渐成为趋势。

农业灌溉用水的监测和计量对于制订农业灌溉计划和安排灌溉任务尤为重要。农业灌溉用水计量作为水资源管理的重要手段,对于解决农业水资源短缺、合理配置农业用水、提高农业用水效率和缓解水资源供需矛盾有着十分重要的意义 [5] [6] [7]。但是对我国农业灌溉用水计量工作的统计中发现,由于传统农业灌溉思想的长期影响,很多灌溉站对农业灌溉用水的计量工作重视程度不足,存在着基础设备陈旧、测量水量成本高、点多面广等问题,制约了节约用水和农业水价综合改革工作的开展。且现有的农业灌溉用水监测和计量技术复杂,所需设备和人力大多耗资昂贵,难以连续地进行。我国现有的农业用水计量方式分为直接计量和间接计量两大类,其中间接计量中的电水转换法能够采用电流间接测量灌溉站实时灌溉用水量,具有精准度较高、成本较低、实施简单等特点,本文选择具有农用电灌站较多的宁夏西干渠管理处马场滩灌溉站为例,利用多项式回归算法,构建电量水量转换模型,实现对灌溉站用水的计量工作,有利于节约水资源,促进我国农业水价综合改革的开展。

2. 相关研究现状

2.1. 农业用水计量方法研究现状

目前,我国现有的农业用水计量方式分为直接计量和间接计量两大类。直接计量是由易观测的水位经过水位流量关系转换得到估算用水量,根据实测水位与流量数据准确建立水位流量模型,合理评价估算流量不确定性后对模型进行修正 [8] [9]。现有的基于水位流量关系计量模型,其计量流量的不确定性主要来自水位流量关系的不确定性,体现在测量不确定性、参数不确定性、模型不确定性、时变不确定性四个方面 [10];在利用遥感技术进行用水计量方面,熊龙海等 [11] 提出基于SPOT5遥感影像和DEM的河流流量计量方法,并利用该方法对东江干流及秋香江、西枝江上7个断面的流量进行了估算,王鹏飞等 [12] 通过低空遥感及卫星遥感数据快捷方便地获取河流信息,并依据水力几何形态理论对河流流量建模预测;此外还有采用电磁流量计、超声波流量计等仪表设备进行计量 [13],王怀博等 [14] 建立量测水设备比测综合评价指标体系,对不同测流原理设备进行比测,并对各类设备进行量化研究后发现结合电磁法和超声波原理的设备准确性较高,但稳定性不足。研究发现直接计量方法存在着实现较为困难、难以连续进行、模型不确定因素较大、农业用水量数据精度较差、量水设备配套不完善等问题 [15]。基于此,也有学者探究直接测量法与模型相结合的方式,温进化等 [16] 根据南方多水源灌区用水特点,基于水循环理论,通过必要的直接用水监测与人工水循环过程模型,实现将用水量直接计量与模型计算相融合。但是在实际应用中考虑到现实情况,通常采用间接计量方法。间接计量的方法是通过易测量的指标间接估算用水量,包括时间法、电水转换法、油耗法等 [17]。

2.2. 电水转换法研究现状

电水转换法是一种经济有效的农业用水计量方法,构建高效合理的电量水量转换模型反映耗电量和供水量之间的关系对于农业用水量监测和计量有着重要作用。邬智俊等 [18] 采用基于改进粒子群的电水转换法对南通市农用电灌站进行农业灌溉用水的计量,并发现利用电水转换法拟合的特征关系曲线能够更真实的反应耗电量和供水量的关系。李娜 [19] 以河北省沧县试验区为例,采取典型法和水电转化法分别对全县农业灌溉用水量进行计算,发现对于计量农业灌溉地下水利用率电水转换法更加接近实际。王向飞 [20] 将电水转换法应用到农业灌溉地下水开采量计量工作中,解决传统估计方法精度较低的问题,测量机井潜水泵的电水转换系统,并根据其灌溉的耗电量,计算开采量,从而提高结果的精确度。沈波等 [21] 探究南通市中小型混流泵中电水转换法的实际应用情况,研究发现电水转换法具有计算简单、操作方便、维护费用低等特点,可作为提水灌区农业用水计量的首选方式。

综上所述,直接计量的农业用水计量方式存在设备成本高、安装实施难度大等问题,难以实现大规模全覆盖对灌区用水进行计量,而间接计量的方法应用较广。其中电水转换法具有操作简单、费用较低等特色,可作为农业灌溉用水计量的首选方法。本文主要以宁夏西干渠管理处马场滩灌溉站为例,宁夏西干渠管理处具有数量较为庞大的农用电灌站,且大多为中小型泵站,由于历史原因,泵站不具备遥感测量仪器、电磁流量计、超声波测流仪等设备,如果采用直接测量方法,需对现有泵站进行改造,将会出现工程量大、经费预算高、实施困难等问题。因此结合西干渠管理处现状和实地设施条件的限制,为了尽可能提高泵站水量计算的精度,从数据分析视角构建一种基于高阶多项式回归算法的电量水量转换模型,挖掘水位、泵站耗电量与出水量之间的关系,提高农业用水效率,节约灌溉用水,并实现大规模、低成本、全覆盖地对宁夏西干渠各个扬水泵站出水量的监测和计量。

3. 研究区域及数据来源

3.1. 研究区域

西干渠全长112.7 km,是河西灌区地理位置最高的一条干渠,横贯青铜峡市、永宁县、银川市、贺兰县,止于平罗县崇岗镇暖泉村。西干渠在承担贺兰山沿线农田灌溉、贺兰山东麓百万葡萄长廊、银西生态用水任务的同时,还肩负着保护银川市及贺兰山沿线防洪安全的重任。西干渠引黄河水灌溉贺兰山沿线82万亩土地,供水范围已辐射2区4县(市) 8个国营农场和贺兰山东麓22万亩葡萄长廊以及银西生态用水,灌溉范围广,年灌溉用水量巨大。

西干渠下属马场滩泵站坐落于西干渠7 + 349处左岸,安装2台单级双吸中开式卧式离心泵,同时配置两台变频电机。2台机组共用一根DN600出水压力管道。总计装机容量500 kw,水泵设计流量0.29 m3,水泵设计扬程57 m,水泵轴功率最大可达208 kW,压力管线干管管线长4.23 km,灌溉面积1.2万亩。

3.2. 数据来源

研究数据来源于宁夏西干渠马场滩泵站2019年~2020年泵站电机运行时水泵定子电流等参数,以及对应干渠水位实测值。本文过对上述千余条泵站实际运行数据建立电量水量转换模型,实现对马场滩泵站出水瞬时流量的监测和计量。

4. 模型构建

普通线性回归模型研究的是一个因变量与多个自变量之间的线性回归关系,但却忽略了因变量与多个自变量组合项之间的关系,导致在实际预测时线性回归模型产生较大误差。因此,本文采用改进后的高阶多项式回归模型,向模型中加入各自变量的高阶多项式和多个自变量的组合多项式。高阶多项式回归中,通过加入特征的更高次方和特征多项式以增加模型的自由度,用来捕获数据中非线性的变化。随着模型复杂度的升高,模型的容量以及拟合数据的能力增加,可以进一步降低训练误差,提高模型预测准确率 [22] [23]。

定义 x ˜ n = ( x 1 , x 2 , , x n ) 表示有n个输入变量的向量, χ j ( x ˜ n ) 表示该向量的第j个多项式组合项,对于有n个输入变量的向量而言,其具有的k次多项式组合项个数 [24] 为 i = 1 k C i + n 1 n 1 ,如对2个输入变量的2次多项式组合项有5个,分别为 x 1 , x 2 , x 1 x 2 , x 1 2 , x 2 2 。设 y ( x ˜ n ) x ˜ n 对应预测值的真实值,则多项式回归的目标求使式(1)所示的均方误差最小的参数 ( ω * , b * )

f k ( x ˜ n ) = j = 1 N ω j χ j ( x ˜ n ) + b (1)

( ω * , b * ) = arg min ( ω , b ) i = 1 m ( f k ( x ˜ n i ) y k ( x ˜ n i ) ) 2 (2)

式中 f k ( x ˜ n ) 表示有n个输入变量的k阶多项式回归函数, ω j 代表 χ j ( x ˜ n ) 第j个多项式组合项的系数,N为 f k ( x ˜ n ) 所有多项式组合项个数且 N = i = 1 k C i + n 1 n 1 f k ( x ˜ n i ) y k ( x ˜ n i ) 表示有n个输入变量的k阶多项式回归函数的第i个样本的预测值和真实值,m表示样本总数。令 E ( ω , b ) = i = 1 m ( f k ( x ˜ n i ) y k ( x ˜ n i ) ) 2 ,令 x i = ( χ 1 ( x ˜ n i ) , χ 2 ( x ˜ n i ) , , χ N ( x ˜ n i ) ) 表示第i个样本经过高阶多项式变换后的组合项向量,对式(2)中的 ω

b分别求导可得:

E ( ω , b ) ω = 2 ( ω i = 1 m x i 2 i = 1 m ( y k ( x ˜ n i ) b ) x i ) (3)

E ( ω , b ) b = 2 ( m b i = 1 m ( y k ( x ˜ n i ) ω x i ) ) (4)

其中 ω = ( ω 1 , ω 2 , , ω N ) T ,令式(3)、式(4)为零可得到 ω 和b最优解的闭式解式(5)、(6):

ω = i = 1 m y k ( x ˜ n i ) ( x i x ¯ ) i = 1 m x i 2 1 m ( i = 1 m x i ) 2 (5)

b = 1 m i = 1 m ( y k ( x ˜ n i ) ω x i ) (6)

x ¯ = 1 m i = 1 m x i (7)

通过式(5)、(6)所求得的 ω 和b即为电量水量转换模型参数。

5. 实例验证

本文将宁夏西干渠管理处马场滩灌溉站泵站电机运行数据及干渠水位带入第2节所构建电量水量转换模型中运算,输入变量为1号电机定子电流、2号电机定子电流和干渠水位。得到其模型准确率和误差与高阶多项式阶数的关系分别如图1图2所示:

Figure 1. Model order-prediction accuracy graph

图1. 模型阶数–预测正确率关系图

Figure 2. Relationship between polynomial features and mean absolute error

图2. 多项式特征与平均绝对误差关系图

由上图可得,随着多项式阶数的增加,模型预测正确率先上升后下降,并在阶数为6时达到最高预测正确率,模型平均绝对值误差先减少后增大,并在阶数为3时达到最小平均绝对值误差。而模型正确率在阶数为3、4、5、6时分别为96.17%、96.23%、96.29%、96.33%,模型精确度基本一致。模型复杂度随着阶数提升而呈指数型增长,高阶模型在实际实施中代价较高且试试较为困难。因此,综合考虑模型准确性、精度和误差与实际实施难度之间的关系并进行权衡后,本文高阶多项式回归模型阶数为3。

本文采用有3个输入变量的3阶多项式回归模型。模型共有19个多项式组合项,部分原始数据及其进行多项式组合项变换后的数据分别如表1表2所示:

Table 1. Raw data

表1. 原始数据

Table 2. Polynomial transformed data

表2. 多项式变换后数据

表1表2中X1、X2、X3分别表示干渠水位、1号电机定子电流和2号电机定子电流。

实际计算时为使数据在一个数量级上,需对输入的较大数量级变量1号电机定子电流、2号电机定子电流进行处理。若采用归一化将变量变化范围控制在0至1之间,会使得变量因归一化而失去量纲,即定子电流归一化后电流值成了一种相对值,“电流”这个量纲也没有了,导致失去量纲的数据在高阶多项式回归时误差较大。而将电流值除以100后的电流值与干渠水位值则在一个数量级上,因此实际带入计算的定子电流数值为单位为百安培。

通过高阶多项式回归对式(5)、式(6)求解后参数 ω 和b的最优解如表3所示:

Table 3. Model parameters

表3. 模型参数

表中X1列的值表示多项式组合项X1对应的系数值,其余多项式组合项列对应的值含义一致。

将实际数据带入高阶多项式回归模型求解所得的回归方程进行验证,计算后得到回归方程预测结果的平均绝对值误差为0.0092,模型误差较小,预测结果符合实际,模型能够很好的对泵站流量进行计量。通过对西干渠管理处马场滩灌溉站泵站的1000余条运行数据的真实值和模型预测值进行对比分析后发现,模型预测值大多在真实值附近表明模型较为准确地预测了泵站出口瞬时流量值。模型对异常点进行修复并将预测结果预测在符合实际的0.49附近,表明模型具有较强的泛化能力和鲁棒性。由于实际需要,泵站有时只开一台泵,导致出口瞬时流量有很大幅度的下降,如图中右下角所示,模型依旧能对这些较小流量值进行准确地预测。由此可见,模型在鲁棒性和预测准确性方面均有较好表现,能够较为准确和稳定地预测泵站出口瞬时流量。

6. 结语

本文采用高阶多项式回归算法,从数据分析的角度对宁夏西干渠管理处马场滩灌溉站泵站出口瞬时流量建立电量水量转换预测模型。实例验证后发现高阶多项式回归模型预测准确度较高,能够应用于泵站出口水量的日常监测和计量,为灌溉计划的制订、实施提供辅助决策。并对农业用水进行准确地计量收费,有利于促进节约灌溉用水和为全面开创节水型社会建设提供有利的支撑。

普通线性回归模型研究的是一个因变量与多个自变量之间的线性回归关系,但却忽略了因变量与多个自变量组合项之间的关系,导致在实际预测时线性回归模型产生较大误差。而本文采用改进后的高阶多项式回归模型,向模型中加入各自变量的高阶多项式和多个自变量的组合多项式,使得模型的容量和数据拟合准确度均有较大提升。结果表明高阶多项式回归模型能够较为准确地预测宁夏西干渠管理处马场滩灌溉站泵站出口瞬时流量,回归模型预测结果的平均绝对值误差为0.0092。此外模型还具有较强的鲁棒性,能够识别人工记录错误的数据并对数据进行修复,为错误数据预测较为合理的值。

相比于使用电磁流量计、超声波测量等直接测量的方式,采用间接测量的方法,准确度高、成本低、操作简单、易于实施,便于在类似马场滩灌溉站的中小型泵站进行应用,易于实现灌区大规模、低成本、全覆盖的农业用水监测计量。

参考文献

[1] 冯保清. 我国不同尺度灌溉用水效率评价与管理研究[D]: [博士学位论文]. 北京: 中国水利水电科学研究院, 2013.
[2] 赵令, 雷波, 苏涛, 周亮. 我国粮食主产区农业灌溉节水潜力估算研究[J]. 节水灌溉, 2019(8): 130-133.
[3] Pedro-Monzonis, M., Solera, A., Ferrer, J., Andreu, J. and Estrela, T. (2016) Water Accounting for Stressed River Basins Based on Water Resources Management Models. Science of the Total Environment, 565, 181-190.
https://doi.org/10.1016/j.scitotenv.2016.04.161
[4] 李仰斌, 刘俊萍. 中国节水灌溉装备与技术发展展望[J]. 排灌机械工程学报, 2020, 38(7): 738-742.
[5] 付强, 刘烨, 李天霄, 崔嵩, 刘东, 成琨. 水足迹视角下黑龙江省粮食生产用水分析[J]. 农业机械学报, 2017, 48(6): 184-192.
[6] 王玉宝, 吴普特, 孙世坤, 操信春, 刘静. 我国粮食虚拟水流动对水资源和区域经济的影响[J]. 农业机械学报, 2015, 46(10): 208-215.
[7] 陈红光, 王琼雅, 李晓宁, 王中君, 李晨阳. 基于区间两阶段鲁棒优化模型的灌区水资源优化配置[J]. 农业机械学报, 2019, 50(3): 271-280.
[8] McMahon, T.A. and Peel, M.C. (2019) Uncertainty in Stage-Discharge Rating Curves: Application to Australian Hydrologic Reference Stations Data. Hydrological Sciences Journal, 64, 255-275.
https://doi.org/10.1080/02626667.2019.1577555
[9] 邱江潮, 刘丙军, 杨子博, 彭为. 基于水位流量关系的流量估算不确定性分析[J]. 水科学进展, 2020, 31(2): 214-223.
[10] Kiang, J.E., Gazoorian, C., McMillan, H., Coxon, G., Le Coz, J., Westerberg, I.K., et al. (2018) A Comparison of Methods for Streamflow Uncertainty Estimation. Water Resources Research, 54, 7149-7176.
https://doi.org/10.1029/2018WR022708
[11] 熊龙海, 邓孺孺, 刘英飞, 梁业恒. 基于SPOT5遥感影像和 DEM 的河流流量估算[C]//2016中国地理信息科学理论与方法学术年会论文集. 2016: 1-4.
[12] 王鹏飞, 杨胜天, 王娟, 潘天力, 章四龙, 巩同梁. 星-机一体的水力几何形态流量估算方法[J]. 水利学报, 2020, 51(4): 492-504.
[13] 闫兵. 流量计在农田灌溉中的应用分析[J]. 农机化研究, 2009, 31(6): 248-249+252.
[14] 王怀博, 徐利岗, 刘学军, 苏笑曦. 宁夏引黄灌区斗渠量测水设备比测试验研究[J]. 水资源与水工程学报, 2018, 29(6): 250-255.
[15] 沈波, 吉庆丰, 张玉建, 刘美华, 许赤. 农业灌溉用水计量方法研究[J]. 江苏水利, 2017(4): 13-17.
[16] 温进化, 王贺龙, 王士武. 南方多水源灌区农业灌溉用水量监测及统计研究[J]. 西北大学学报(自然科学版), 2020, 50(5): 755-760+770.
https://doi.org/10.16152/j.cnki.xdxbzr.2020-05-008
[17] 王成福, 罗浩, 景少波. 浅析我国农业灌区用水量测技术的现状与发展[J]. 陕西水利, 2016(4): 167-168.
[18] 邬智俊, 胡钢, 沈波, 刘美华, 章梅娟. 基于改进粒子群的电水转换关系特征曲线研究[J]. 节水灌溉, 2018(9): 98-101+107.
[19] 李娜. 关于农业灌溉用水计量方法的探讨[J]. 水科学与工程技术, 2014(6): 67-71.
[20] 王向飞. 电水转换法在地下水开采量计量中的应用——以河北省沧县为例[J]. 海河水利, 2014(6): 50-51.
[21] 沈波, 吉庆丰, 张玉建, 刘美华, 许赤. 农业灌溉用水计量方法研究[J]. 江苏水利, 2017(4): 13-17.
https://doi.org/10.16310/j.cnki.jssl.2017.04.004
[22] Bertsimas, D. and Van Parys, B. (2020) Sparse Hierarchical Regression with Polynomials. Machine Learning, 109, 973-997.
https://doi.org/10.1007/s10994-020-05868-6
[23] 张东明, 张晓云, 杨小波, 侯心一. 基于正交实验和多项式回归分析方法的非典型接触状态车人碰撞事故参数分析[J]. 上海交通大学学报, 2019, 53(1): 55-61.
[24] 李梦慧, 谭鸽伟, 孟亭亭, 杨晶晶. 基于Legendre多项式展开的双基SAR二维频域成像算法[J]. 计算机应用研究, 2020, 37(11): 3476-3480+3491.