1. 引言
核电具备资源消耗少、供电能力强和环境影响低的优点,为目前全球电力供应支柱之一。我国现运行的核电厂大部分为压水堆核电厂,压水堆初为美国核潜艇堆型之一,后发展为陆地堆型,目前其装机容量占据全球各类反应堆的60%以上。其冷却剂为轻水,廉价且热能传输性能优良,其缺点是沸点较低,需要高压环境以获得高温。
压水堆核电厂投入运行后,在每个堆芯寿期末都要停堆换料。堆芯换料过程中,将产生大量的换料方案,而换料方案的选择直接关系到核电厂运行的安全性和经济性。一个优选的堆芯装载方案,可较好地展平堆芯功率分布、增加卸料燃耗深度、延长堆芯换料周期、提高燃料利用率,从而提高核电经济性和安全性。
然而,换料方案设计涉及热工水力、中子物理、反应堆控制等高维度复杂问题,传统的计算方法面临求解效率的问题。由于应用神经网络(Neural Network, NN)技术能够避免传统算法中的维度灾难的困难,且无需考虑自变量与因变量之间知识性关系,因此能够基于数据特征建立(即数据驱动)问题系统的数学模型。目前,神经网络已在核能领域已有一些研究与应用。Santosh等人 [1] 基于神经网络框架研究核电站瞬态事故诊断。Mo,Lee等 [2] 基于神经网络开发核电站操作指导系统。Pirouzmand,Ahmad [3] 使用神经网络预测反应堆轴向相对功率分布以及反应堆功率峰因子。Bahuguna [4] 基于神经网络实现实时堆芯中子通量分布预测与监控。Souza,Moreira等 [5] 使用神经网络模型预测功率峰因子。Candini [6] 基于循环神经网络模拟实现随时间变化的核反应堆非线性动态系统。Ortiz,Requena等 [7] 基于RNN预测沸水堆热参数以及有效增殖因数。Hadad等 [8] 将卷积神经网络应用于求解核反应堆动力学方程。
在优化方法方面,确定论优化方法主要研究方向是简化问题模型,提出问题的合理假设,实现问题线性化以及脱耦处理。DIRECT/POISPUT程序 [9] 和OPHAL/SPOT程序 [10] 提出将燃料组件的布置优化和可燃毒物的布置优化分开的脱藕方法。美国西屋公司(Westinghouse)开发了基于“目标功率分布–目标反应性分布”的逆向算法 [11] 的ALPS程序 [12] (Advanced Loading Pattern Search Program),曾广泛使用于西屋公司设计的40余座压水堆核电厂的换料优化中。由美国西屋公司与上海核工程研究设计院联合开发的LP-FUN程序(Loading Patterns for User’s Need, PEARLS),又进一步提高搜索精度与效率。优化方法的另一类是随机优化方法,其通过引入生存判别机制、进化指引机制实现进化搜索,主要研究方向是提高对解空间的搜索效率。Stevens等 [13] 结合SIMULATE-3和CASMO-3中子物理计算程序开发了进行换料优化的模拟退火优化系统。Yamamoto等 [14] 基于混合遗传算法开发了GALLOP (燃料管理程序);Francois,Lopez等 [15] 利用遗传算法开展了沸水堆燃料管理优化的研究;Abbassi [16] 等在压水堆换料优化研究中采用粒子群算法;Fadaei等人 [17] 在Bushehr’s VVER-1000反应堆的换料优化中结合了遗传算法、粒子群算法、细胞自动机算法等多种算法。
尽管在堆芯计算与换料方案设计两方面有很多独立的研究,但少有联合神经网络与随机优化算法实现整个换料流程自动化、智能化的研究,本文一方面研究基于集成神经网络的先进预测算法,一方面研究基于蚁群觅食机理的蚁群优化算法,在压水堆换料优化方法研究中联合运用这两种算法。在换料空间搜索最优的换料方案中利用蚁群算法(Ant Colony Optimization, ACO),可以发挥随机优化算法解决优化函数形式复杂或不连续、不可微、不可导的问题,可实现并行处理、快速收敛;利用神经网络算法可以直接跳过求解具体堆芯物理方程、公式等而快速、精确预测堆芯关键参数。这种方法将改善传统依赖物理过程计算堆芯参数方法的低效和复杂度,为反应堆换料设计提供基于人工智能的快速、高效的解决方案。
2. 数据预处理
使用CASMO-5软件模拟计算数量尽可能多的堆芯数据样本,对其输入、输出数据进行处理,为数值实验与数据分析提供基础。
2.1. 数据获取
(a) (b)
Figure 1. The core array of a pressurized water reactor
图1. 一个压水堆的堆芯阵列
某型号压水堆堆芯组件阵列如图1所示,具有对称分布特性,其1/8即具有整个阵列的全部组件种类以及排布特征。根据组件区分方法,堆芯燃料中包含四大类(E、F、G、H)组件,分别是三次燃耗组件、二次燃耗组件、一次燃耗组件和全新燃耗组件,其后的不同数字则区分其燃耗深度的不同,因此在此类压水堆堆芯中存在16种不同的燃料组件。
该反应堆燃料阵列的排布设计中组件被限制在三个区域(如图1(b)所示三个颜色深度不同的区域)内部进行调换。根据组件排布规则设计输入样本并生成输入文件,使用CASMO-5程序模拟计算出对应的堆芯参数,包括有效增殖因数(KEFF)、组件功率峰因子(RAD)和棒功率峰因子(FΔH),产生输出文件。
2.2. 数据处理
从输出文件的文本信息中抽取可用的数据信息,获取具有对应关系的格式化数据集。
2.2.1. 从文本文件提取数据集
对CASMO-5程序模拟计算的输出文件进行处理,获得结构化数据集,其中包括表示燃料组件排布的数据(输入数据)和上述堆芯3个关键参数数据(标签数据),并对标签数据进行统计,数据集信息如表1所示。
2.2.2. 堆芯组件的表示方法
为了利用计算机对数据进行计算,需组件排布的实数表示。一个16位二进制序列可以表示16个不相同的组件中的一个,并使得任意两个组件之间的表示差别均只出现在两个数位上。这种设置的基本出发点是,压水堆堆芯关键参数因堆芯燃料组件种类与排布次序变化而变化,为减少引入不必要的人为干扰因素,假设组件种类之间的区别是同等的,故引入“01序列”编码,以“1”的位置区别不同组件,表示方法表示如图2所示,将H组件编码为0000 0000 0000 0001,将G19组件编码为0000 0000 0000 0010等。
![](//html.hanspub.org/file/10-3150246x11_hanspub.png?20230203085920842)
Figure 2. Binary representation of core components
图2. 堆芯组件的二进制数表示
2.2.3. 数据均衡处理的方法
用于训练的数据集,是以组件排布方式均衡为目标抽样得到的,计算获得的三个关键参数统计分布呈高斯分布,并不平均。这种情况会使预测模型因为过多的中部训练数值而导致预测向之“偏好”,因为只要数据较多的中部数据预测精度足够,其余位置数据的误差即使较大对结果影响也甚微。
均衡处理有两个方向:对小样本数据重复抽样和对大样本数据进行局部抽样。本文通过Bagging集成的方法对数据同时采用两种方法进行样本均衡处理,3.1.1节将对此进一步论述。
3. 算法设计与实现
燃料排布事关堆芯产生的效益,尽管要知道每一种组件排布所对应的效益并不容易,却可以通过反应堆中一些关键的参数指标来指导核燃料装载的选择。对于大量排列组合的计算,模拟方法所要付出的时间成本过高,还容易因为参数的变化而不得不重新计算。使用模拟方法计算出一定数量的数据,然后利用神经网络完成剩余的估算是解决这个问题的一个方法。利用神经网络快速预测堆芯参数还可以为优化算法的大范围搜索提供可行性,据此可建联合算法。
3.1. Bagging-NN-ACO联合算法框架
神经网络与蚁群优化(NN-ACO)联合算法的基本思想是,基于神经网络进行堆芯参数的预测,实现蚁群算法目标函数的快速计算,从而利用蚁群算法对优化空间进行大范围搜索。
基于神经网络的装袋集成学习方法(Bagging Neural Network, Bagging-NN)使用多个独立训练的神经网络组成预测模型。基于蚁群算法(ACO)的优化模型利用预测模型进行适应度的计算,通过种群进化实现优化计算,其框架如图3所示。
![](//html.hanspub.org/file/10-3150246x12_hanspub.png?20230203085920842)
Figure 3. Bagging-NN-ACO joint algorithm framework
图3. Bagging-NN-ACO联合算法框架
3.1.1. Bagging-NN架构
(一) 装袋算法
装袋算法(bootstrap aggregating, Bagging),一种通过组合多个模型来减少泛化误差的集成方法,以模型平均(model averaging)策略 [18] [19] [20] 为基本思想,即独立训练数个不同模型,然后让它们在测试集的输出上投票,算法流程如图4所示。
机器学习中的模型平均(model averaging)策略在工程应用、竞赛实践中是一个普遍的选择。模型平均的意义是,不同的模型在测试集上通常产生不一样的误差,模型平均可使单独模型产生的随机误差相互抵消,集成模型可有效且可靠地减少误差。
模型平均有效的原因或者前提是模型误差相关性较低。假设拥有k个模型,第i个模型在数据上的误差为εi,服从μ = 0,
,
的多变量正态分布,则模型平均误差如式(1)所示。
(1)
在式(1)中,如果单独模型误差完全不相关,即c为0,则模型平均误差的期望为v/k;如果模型的误差完全相关,即v = c,则结果为v,模型平均将失去减小误差作用。
(二) 装袋算法的数据平衡
数据集是基于自变量均匀抽取计算获得的,而其因变量的分布总体上是呈现高斯分布的,即靠近均值的数值频数增大,趋近边界的数值频率渐少。
从总体数据集中划出部分不参与训练的数据,作为测试集。对剩余数据进行多次抽样得到多个子训练集。每个子训练集采用“全局随机放回抽样 + 重点局部随机放回抽样”结合,其中“全局”指所有剩余数据,是总体数据,“重点局部”指剩余数据中的边界数据及其邻域内的数据,为重点数据。子训练集因此包含了更多的边界附近的数据,从而一定程度的削弱了原始数据的不平衡性,Bagging-NN的流程如图5所示。
图5中模型1到模型10为神经网络模型,本文选用结构较为简单的三层神经网络作为基础模型(基学习器),其拓扑图形如图6所示,包括一个输入层、一个输出层和一个隐藏层。
![](//html.hanspub.org/file/10-3150246x17_hanspub.png?20230203085920842)
Figure 5. Bagging-NN algorithm flow
图5. Bagging-NN算法流程
3.1.2. ACO算法架构
蚁群优化算法由Marco Dorigo于1991年在其博士论文 [21] 中提出的用以优化图中路径的几率型算法,模拟蚁群从蚁巢到食物源沿最优路径觅食的行为,并成功用以组合优化问题求解。Goss、Deneubourg等人 [22] 利用二元桥实验进行了蚂蚁从蚁巢到食物源觅食过程中寻找最优路径原理的研究。
蚁群算法架构包括信息素矩阵、信息素增量规则以及转移概率等,以Pheromone表示信息素矩阵:
(2)
其中τij表示城市ci到城市cj之间的信息素强度。其更新公式:
(3)
其中
,表示信息素的挥发率,用以表示信息素随时间的衰减率。
表示第k只蚂蚁在第t次迭代中为路径(i, j)带来的信息素增量。信息素增量规则:
(4)
其中Lk为第k只蚂蚁一次迭代经历路径长度。蚂蚁从一个城市向另一个城市转移的的概率与两者间的信息素强度相关,以转移概率表示如式(5)。
(5)
式中,
为蚂蚁从城市i选择向城市j转移的概率,
为路径(i, j)上的信息素强度,
为路径(i, j)的启发信息,上式指出,
与
成正比,其中α、β反映信息素阈启发信息的相对重要性。避免蚂蚁移向已经访问过的城市,使用禁忌表的形式对蚂蚁的前进设置约束条件。
在压水反应堆堆芯燃料组件排布优化问题中,把每一个组件都看作一个“城市”,可以将组件的排布问题转换成旅行商问题(Traveling Salesman Problem, TSP)。据堆芯组件阵列设计约束可知组件在三个区域自行排列,即形成三个独立“城市群”,蚂蚁须首先走完“城市群”内部城市,再向下一个城市群进发,如图7所示。在这个非线性规划问题中,解空间内约有6.27 × 1010种排布方式,即为蚂蚁可以选择行进路线的总数。
![](//html.hanspub.org/file/10-3150246x30_hanspub.png?20230203085920842)
Figure 7. Transformation of TSP problem assuming components as travel targets
图7. 将组件假设为旅行目标的TSP问题转换
值得注意的是,与通常的TSP相比,虽然目标都是对“城市”的序列连线,但“距离”的定义不为坐标距离,且路径是单向的,不形成闭环。本问题的“距离”是组件(城市)排布对应的堆芯参数数值,且与组件的先后顺序有关,即城市A-城市B与城市B-城市A的距离是不同的,同时信息素也是不一定相同的,即式(2)中有
。
3.2. 预测模型训练与堆芯燃料排布优化
3.2.1. 神经网络模型训练
选用的神经网络模型输入层、隐藏层和输出层的规模为(320, 1024, 1),因而其权重数量约为33万个。神经网络模型的训练流程如图8所示,以KEFF、RAD、FΔH参数中的每个作为对象,进行多次训练并统计结果。
![](//html.hanspub.org/file/10-3150246x32_hanspub.png?20230203085920842)
Figure 8. The training process of the neural network model
图8. 神经网络模型的训练流程
使用平均相对误差(MAPE)、最大相对误差(Max_e)等作为评价模型性能的主要指标,其定义与公式示意如下。
(6)
(7)
(8)
MAPE为测试集中所有样本相对偏差的平均值,越小说明模型性能越好;Max_e为测试集所有样本相对偏差的最大,表示最坏结果的恶劣程度值,其值越小,说明学习器的下限越高;R表示测试集样本相对偏差在5%以内的频率或概率。对堆芯KEFF、RAD、FΔH等3个关键参数进行预测的3个集成网络的训练结果如表2~4所示。从表中可以得出结论,Bagging-NN性能均优于任何单独的模型。总体而言,相对误差有2.5%~60%的提升,最大相对误差有0%~61%的提升,而R有最高78%的提升。
![](Images/Table_Tmp.jpg)
Table 2. KEFF experimental results
表2. KEFF实验结果
注:① KEFF的R为测试集样本相对偏差在1%以内的频率或概率。
如图9~11所示,以测试集真实值为x坐标,以Bagging-NN预测值为y坐标绘制散点,得到所有测试集样本的预测结果分布。图中e = 0线为x = y曲线,即预测值与真实值相等,显然,越靠近该曲线误差越小,散点越是紧密分布在曲线周围,模型性能越好。此外图中还添加了长虚线表示两者误差为10% (1%)的位置,点虚线表示两者误差为5% (0.5%)的位置,因此散点代表了预测值对真实值的偏移情况。
总体而言,绝大多数散点位于实线附近,仅有少许RAD、FΔH的数据在点虚线之外,但均在长虚线之内。对于KEFF数据,Bagging-NN的最大误差未超过0.5%,平均更在0.1%以内,可见模型的精度高、拟合度好,具有很好的鲁棒性。
![](//html.hanspub.org/file/10-3150246x36_hanspub.png?20230203085920842)
Figure 9. The distribution of prediction points of the model on the test set (KEFF data)
图9. 模型在测试集(KEFF数据)上的预测点分布情况
![](//html.hanspub.org/file/10-3150246x37_hanspub.png?20230203085920842)
Figure 10. The distribution of prediction points of the model on the test set (RAD data)
图10. 模型在测试集(RAD数据)上的预测点分布情况
![](//html.hanspub.org/file/10-3150246x38_hanspub.png?20230203085920842)
Figure 11. The distribution of prediction points of the model on the test set (FΔH data)
图11. 模型在测试集(FΔH数据)上的预测点分布情况
3.2.2. 堆芯燃料排布优化
堆芯燃料排布优化是一个多目标优化问题,本文研究对象是秦山二期平衡循环(换料周期为12个月),堆内无可燃毒物,因此可以将参数KEFF、RAD和FΔH作为优化目标,目标函数定义如下:
(9)
其中,δ为用以保证
为正值的常数。在蚁群算法、遗传算法等问题中,目标函数通常也称适应度函数,以适应度值大小来决定个体(一个解决方案)的优劣程度,从而决定其被选择的几率大小。对于一个种群而言,统计种群中所有个体的适应度可以得到平均适应度值以反映当前种群进化的平均水平,最大适应度以反映当前种群所能达到的最高水平。
(9)式中ωKEFF、ωRAD、ωFΔH代表三个堆芯参数的适应度所占的权重,不同的问题可能对这三个参数的重视程度不相同,对应权重值也不相同。式中
、
、
均为非线性函数,因此堆芯燃料排布优化是一个带有约束条件的优化问题,称为约束非线性优化问题,其形式如式(10)所示。
(10)
当ωKEFF = 1、ωRAD = ωFΔH = 0时,目标函数为
,此时蚂蚁的行进“距离”表示的是有效增值因子的值,即堆芯燃料排布为单目标优化问题。若同时考虑堆芯三个参数的变化,其中KEFF参数极大化,而FΔH、RAD极小化,各参数的重要性相当,即ωKEFF = 1,ωRAD = ωFΔH = −1,此时堆芯燃料排布为多目标优化问题,目标函数表达式为:
(11)
图12~14为多目标优化下,适应度值、堆芯参数值随迭代次数变化和组件信息素热图。图12中,平均适应度在前1000代从3.639431提升到3.904264,最大适应度在前1800代左右提升到最大,为4.46735。图13为堆芯三个参数的变化情况,其变化发生在前1800次迭代中。图14为优化结束后产生的信息素矩阵热图,从图中可以看出,对于多目标优化,“ST—>H02”的信息素最强,说明适应度较大的路线以H02为起始城市的概率最大。同理,可根据图中方块色彩深度看出不同组件间的信息素强度,该信息指出了城市顺序对路径适应度(即组件顺序对堆芯参数)的优化贡献大小。
![](//html.hanspub.org/file/10-3150246x47_hanspub.png?20230203085920842)
Figure 12. The search curve of ant colony algorithm under multi-objective optimization
图12. 多目标优化下蚁群算法的搜索曲线
优化实验结果如表5所示,包括单目标优化与多目标优化的平均适应度的提升比例,最大适应度的提升比例等,从表中可看出,多目标优化相对单目标优化适应度提升更加明显,两者最大适应度均突破了数据集的最大适应度,说明蚁群算法能找到了比数据集更优的解。
![](Images/Table_Tmp.jpg)
Table 5. Fitness improvement results
表5. 适应度提升结果
4. 结论
结果表明,Bagging-NN-ACO联合算法对堆芯参数预测有优异的性能,较传统模拟计算快速,较单个神经网络预测误差更小,在堆芯组件排布优化设计中能够实现快速搜索,并从更加广泛的样本空间中寻找最优方案。该方法主要基于数据驱动,对数据规模、质量有较高的要求,对反应堆物理、工程专业知识依赖程度较低,适用于结合大数据、数字化的核能科学工程与研究,在实际核电厂运行中结合实际运行数据进一步研究,可将算法运用于实际核能运用中。
NOTES
*通讯作者。