1. 引言
基于知识的系统(KBS)或专家系统被定义为一类智能计算机系统,它们主要依靠领域专家的知识来执行复杂的任务和过程[1]。这样的系统能够模拟人类专家决策过程,因此在处理需要人工介入的极端情况方面具有相当的优势。在现代知识密集型社会中,对复杂系统的理解和控制越来越依赖于高级知识表示和推理模型,如模糊Petri网(FPN)。FPN通过整合模糊逻辑与Petri网的优点,为处理不确定性信息提供了强大的工具[2]。
然而,传统的基于规则的模型在适应信息更新方面存在局限,随着复杂系统日益增加的多变性和动态性,传统FPN在适应性和灵活性方面面临挑战,尤其是在参数学习方面。FPN的有效性在很大程度上取决于模糊规则及其参数的准确性,参数包括权重、阈值和确定性因子等。这些参数的精确设定对于模型的预测性能和推理能力至关重要。然而,由于现实世界的复杂性,这些参数并不是静态的,而是随着环境的变化和新数据的累积而变化。因此,研究FPN的学习机制变得尤为重要,这不仅可以提高模型的适应性和灵活性,还可以确保知识表示的准确性和时效性。随着技术的进步和知识的累积,手动调整参数和更新知识库变得越来越不现实,需要大量的专家时间和劳动。引入有效的学习机制可以自动调整这些参数或规则本身,降低人为干预的需求,同时提高模型的自我适应能力。
要在保持规则不变的情况下进一步提升FPN的学习能力,需要更改其数学公式——即传递逻辑值的计算公式。FPN的参数是可学习的,已有多项研究致力于增强其学习能力[3] [4] [5]。例如,由于Petri网和神经网络的结构相似性,可以使用神经网络中的相同学习算法来训练模糊Petri网,这项研究已在[6]中进行。此外,[7]提出了一个动态表示模糊知识的模型,使用一个有效的优化算法来学习FPN中的所有参数。而在[8]中,开发了一个能够考虑弧权重变化并有能力学习权重的自适应模糊高阶Petri网。
通过使用历史数据训练这些参数,FPN能够更准确地做出未来的决策。此外,FPN的预测准确性很大程度上依赖于构建它的规则,这些规则由专家提出并制定,不应更改。传统的FPN模型将推理过程解释为命题真值的线性传递。尽管该模型可以有效地捕捉线性输入输出关系,但它在处理复杂的非线性关系时表现不足。解决这些复杂性需要一个具有更好表征能力的模型,同时尽可能少地引入参数和结构变化。因此,在我们先前的工作中[9]提出了提出函数链模糊Petri网(FLFPN)模型。该模型通过改变FPN模型的底层数学机理,引入函数链接项以增强其对非线性关系的表达能力,使其获得与高阶神经网络相似的学习性能。除了增强学习性能外,对于改变计算式所导致的权重参数意义丢失问题,此模型采用扰动法以分析各原因命题对结果命题的贡献程度,并将该值作为原权重参数的涵义替代,由此保留了FPN模型的可解释性优势。
在现有的关于匝道控制算法的研究中,极度拥堵、恶劣天气、交通事故以及其他突发状况会极大地影响算法对于匝道流量控制和高速公路拥堵疏解的有效性。在这种情况下,往往需要工程师等人类专家根据实际情况进行判断然后给出针对该场合的策略,基于知识或规则的模型对于这种情形拥有独特的优势,因为它们能够根据现有知识库对专家行为进行模拟,因此在遇到类似情形时能够通过先前的专家经验来模拟专家决策,从而拥有比其他数学模型更优秀的处理极端情况的能力。除了FPN及其改进模型,包括我们所提出的FLFPN模型之外,在匝道控制中使用基于规则的模型的还有模糊逻辑方法[10]。但传统模糊逻辑方法很难根据信息或数据的更新去实时地更新它的规则,不得不依赖人类专家对于规则库的更新,因此缺少一定灵活性。同样是基于规则的模型,本文所采用的FLFPN模型拥有自适应能力,能够通过历史数据去训练和更新模型的参数,甚至纠正规则的冗余部分,不仅能够保留和继承人类专家的智慧结晶,还拥有极强的适应能力去应对这个瞬息万变的时代。
在FLFPN的先前研究中,如何找到网络最优结构参数是一个挑战。引入高阶项会增强模型对非线性关系的表示能力,然而这也不可避免地会增大运算负担。如何在花费尽可能少的运算成本下增强尽可能多的学习能力成为一个难题。因此,本文考虑对FLFPN学习算法中所涉及的遗传算法部分进行优化,找到对于该部分的最优超参数,以小成本实现模型学习性能最大化。另一方面,先前FLFPN模型在匝道车流预测中的应用仅限于局部控制,并且并没有完整地利用模型训练和推理过程中提供的额外信息。本文将继续发掘该模型在构建匝道控制系统中的潜力,发挥其解释性优势,将模型构建与训练过程中的中间产物——对于各路口拥堵情况的分析值用于对未来匝道控制决策的整体判断,因此构成一个以FLFPN模型为核心的完整匝道控制体系。
2. 函数链模糊Petri网
2.1. FLFPN的定义
FLFPN结构被定义为一个12元组:
(1)
其中:
是一个有限的库所集合;
是一个有限的变迁集合;
是一个有限的命题集合,满足
;
是一个
的关联矩阵,用于定义从库所到变迁的有向弧。对于这个矩阵的每个元素,
表示
是变迁
的输入库所,否则,
不是
的输入,对于
和
。
是一个
的关联矩阵,用于定义从变迁到库所的有向弧。对于这个矩阵的每个元素,
表示
是变迁
的输出库所,否则,
不是
的输出,对于
和
。
是一个关联函数,为每个变迁分配一个阈值,可以表示为一个
维向量
。
是一个关联函数,为每个库所分配一个真值,
。
是一个关联函数,为每个节点定义库所和命题之间的双射映射。
是一组权重矩阵。
是一个
的上三角矩阵,即变迁
的权重矩阵,其元素
表示函数链项
的学习权重,对于
,
,
。对于最后一列的元素,
表示一阶项
的权重,对于
。
被设为零是因为一旦引入常数项,阈值判断标准将变得模糊。
是一个关联函数,为每个变迁分配一个确定性因子,可以表示为一个n维向量
。其元素
表示规则的信心程度。
是一个关联函数,定义了每个前提命题对其后续命题的贡献度。它被表示为一个
矩阵,
的值显示了规则输入
对其输出
的相对重要性。在本文中,让
。
是FLFPN的标记。
表示系统在第i次迭代后的标记。
此模型并不是简单地向输入层添加输入,而是将函数链输入视为一个额外的隐藏层,这被称为链接层。变迁条内部封装了与函数链项相关的参数,如图1所示。张量表示输入的维度为h,封装单元
表示由初始输入层生成的第i个函数链输入,对于
。
Figure 1. Internal structure of FLFPN
图1. FLFPN内部结构
2.2. 基于FLFPN的模糊推理
对于一个变迁
,其中
,设
为初始输入集,为了简便起见,定义
。扩展的多项式项表示为
,相应的权重为
。
设
为输出集。该变迁的阈值和确定性因子分别为
和
。
如果变迁
被激活并触发,则
(2)
其中
为加权和。
使用sigmoid函数来近似阈值判断。sigmoid函数表示为
,且
(3)
其中
是一个预定值。本文通常将
设置为一个相对较大的值,如
,以保持函数的斜率较大,使其可以像门控单元一样起作用。因此,输出的真值可以表示为
(4)
如果
足够大,当
时,
,当
时,
。
变迁
触发后,其输入库所中的令牌将被复制并传输到其输出库所
,由其确定性因子生成。
的输出库所的新真值为
(5)
其中
。设
表示变迁
的最终输出值。
如果库所
有多个输入变迁被触发,则其新的真实值由触发变迁的重心决定
(6)
其中
被触发,且
。
2.3. FLFPN学习算法
模型训练和参数学习采用了一种嵌套结构,由遗传算法(GA)和反向传播算法(BP)组成。参数被分为基本参数和结构参数,以此引入的高阶项的精确组合。将阈值、确定性因子和结构参数视为网络超参数,这些将由遗传算法编码确定。在使用BP算法进行权重训练之后可以进行适应度评估,进而确定整体参数性能。整个过程图2所示。
Figure 2. Learning algorithm of FLFPN
图2. FLFPN学习算法
2.3.1. 遗传算法
遗传算法是一种基于进化理论的全局搜索优化算法。它模仿生物进化过程,以染色体的形式表示所有可能性,通过评估、选择、交叉和变异等一系列遗传操作尝试找到最佳解决方案。
对于FLFPN模型,首先需要对三个参数进行编码。
1) 函数链项
一个没有常数项的张量表示模式,如
,可以由一个二进制染色体进行编码。例如,编码
表示选择了
和
项,因此将构建一个包含三个权重的线性网络。
2) 阈值和确定性因子
变迁的
和
值取决于其定义域长度和所需精度[11]。对于定义域长度为
且所需精度为
的变量,编码所需的位数
需满足:
。
由于
和
的范围是
,本文有
。如果所需精度为两位小数,则
。
将满足条件,这意味着本文需要
个二进制位来编码每个变量。
种群中的完整染色体包含FLFPN模型中每个变迁的
个此类二进制片段,
和
的子串可以解码为实数值。例如,如果
的编码是
,那么其实数值为
。
由于GA需要一个适应度函数,在BP训练结束时,将计算训练数据的平均误差,然后计算适应度函数。本文采用平均绝对误差(MAE)与均方根误差(RMSE)作为误差精度衡量标准,具体表达式如下:
(7)
(8)
而适应度函数将采用MAE的倒数:
(9)
2.3.2. 反向传播算法
由于阈值、确定性因子的值以及遗传算法已经给出的新引入的函数链项,这里将简单展示使用反向传播算法进行权重学习的过程。
权重更新规则可以表示为以下方程:
(10)
其中:
表示迭代次数;
是学习率;
是第
层的权重;
是第
层的灵敏度;
是来自第
层的输入项。
3. 基于FLFPN的匝道控制系统
将介绍局部匝道车流预测案例研究。该专家系统主要包括以下规则集:
其中:
局部速度较小;
局部占用率较大;
下游速度较小;
下游占用率较大;
当前道路拥堵程度高;
下游道路拥堵程度高;
匝道流量低。
根据提出的规则,可以建立FLFPN模型,具体如图3所示。
Figure 3. FLFPN model for ramp flow prediction
图3. 匝道车流预测FLFPN模型
利用采集器收集到的速度和占有率数据,根据FLFPN模型和建立的规则来预测匝道流量。在对FLFPN模型进行训练和学习后,即可根据实时占用率与速度获得各路段拥堵级别与匝道流量预测值,从而能够调整匝道计量率。
局部匝道控制的控制行为本质上是确定每个时间间隔应释放到主线的匝道流量。以上制定的规则是根据当前路段与下游路段的车辆速度与占用率对当前两个路段的拥堵程度进行分析,并对未来时刻的匝道流量进行预测。基本上,匝道流量是根据匝道计量率来计算的,该计量率表示为匝道容量的百分比。在此案例中,匝道车流量等同于匝道计量率,这是由于本文所采用的数据取自早晚高峰拥堵时段,因此车辆会按照匝道计量仪的指示等待或放行。而对于其他时刻,例如清晨或深夜时,由于不太可能产生拥堵情况,匝道计量率往往会被设置得尽可能高,但这并不意味着车流量就是大的,毕竟深夜车辆基数就少。在这种情况下,匝道车流量并不完全等同于匝道计量率,此时就需要重新制定一系列规则来针对非拥堵状态的场合,然后再根据所制定规则去搭建FLFPN模型然后训练和学习。
高峰拥堵时段是交通控制研究的重点关注对象,而本文所构建的以FLFPN为核心的匝道控制系统正是希望能够处理这种较为棘手的情形。这一方面是由于FLFPN模型具备的学习能力,另一方面源于其自身的解释性能。除了能够直接根据训练后的模型获得预测的匝道流量外,其关于拥堵程度分析的中间结果同样可以用来进行局部控制之外的整体决策,下文将描述如何构建一个以该模型为核心的匝道控制决策系统。
图4描述了用于高速公路匝道交通控制的整体决策过程。
Figure 4. Overall decision process for freeway ramp control
图4. 高速公路匝道控制总体决策过程
该过程主要涉及三个阶段:
1) 当前交通状况评估
这一阶段涉及评估匝道主线上交通的普遍状态。交通状态由一个称为“拥堵等级”的抽象术语来表示,该术语反映了交通拥堵的严重程度,并通过速度和占用率进行评估。
2) 交通拥堵趋势预测
这一阶段涉及对交通状态变化的预测。鉴于从第一阶段得出的结果,第二阶段继续使用短期交通预测模型来预测未来的交通情况。这些规则通常是状态–状态规则,因为推理得到的是根据交通预测模型从外部变量中推断出来的未来状态。
3) 控制策略和行动建议
在第一和第二阶段的结果基础上,执行连续分析,得出推荐的解决方案。通过这一推理过程,第三阶段的规则涉及策略层面(控制方法)和操作层面(控制行动)。交通运营商可能会考虑本地、协调或综合控制策略,并在选择了控制策略后,系统能够获得推荐的匝道计量率,然后进行实施。在控制实施期间,交通监控系统会不断观察并提供更新的数据和信息给系统,而匝道计量率也会相应调整。控制行动的规则基本上是状态–行动规则,适用于给定的输入–输出映射。
本文将给出控制策略和控制行动的第三阶段。该阶段从第一阶段接收当前交通拥堵级别作为输出,并根据交通拥堵的紧迫性,继续进行第二阶段——交通趋势预测或第三阶段——控制策略和控制行动的推荐。如果拥堵情况紧急,需要立即实施控制措施,第三阶段的规则通常是预期执行的。相反,如果交通拥堵还不是很严重,系统将继续使用交通预测模块中的预测数据,为第三阶段提供预期的拥堵级别。
第三阶段由三个模块组成:干预级别、控制策略和控制行动。干预级别表明应采取何种程度的控制措施来处理拥堵问题,反映了应与当前或预期的交通状况相关联的干预控制的强度。这一模块是两种控制模式即反应控制(使用当前实时交通数据)和预测控制(使用预测交通数据)相结合的结果。控制策略代表了控制方法和应对评估干预级别而采取的适当对策。策略代表供应方,提供了一种广泛的方法论视角,以响应于评估的干预级别。它在面对拥堵问题时,确定了具体控制行动的实施。最后,控制行动反映了特定控制策略的设置,给出了应对拥堵问题的具体控制措施。例如,控制行动包括匝道计量设置、排队管理、路线转向操作和信息传播。
Figure 5. Ramp control decision tree
图5. 匝道控制决策树
图5进一步阐述了从交通状况、干预级别、控制策略到控制行动的决策序列。从系统角度来看,当前/预测的拥堵级别和干预级别是支持决策的中间组成部分。控制方法代表了控制的规模或程度,并且是方法论视角选择控制策略的过渡步骤。控制方法分为无控制、局部控制和广域控制。具体来说,无控制与无干预、局部控制与轻微和中度干预级别关联,广域控制与强烈干预级别关联。
控制策略包括多种选项,包括局部匝道控制、协同匝道控制和整体匝道控制。局部匝道控制对应于当主线交通需求低于匝道上游的队列很短时的局部控制规模。协同匝道控制和整体匝道控制则关联于高速公路走廊范围控制规模,当主线交通需求中高而旁路路线不拥堵时,推荐采用前者。如果匝道上游的长队和分支路线拥堵,则更倾向于后者。在操作期间,如果交通情况发生持续变化,控制方法和控制策略可以相应调整,以适应高速公路和匝道以及受影响的分支路线。
在控制行动方面,局部匝道控制和协同匝道控制策略只动员匝道的交通控制,而整体匝道控制则利用不同的当前措施,实质上是匝道控制和路线转向(通过可变信息标志,VMS),以增强所推动的协同控制效果。鉴于所选择的控制措施,系统根据输入变量计算应该在每个时间间隔排放到高速公路主线上的匝道流量。
4. 实验与分析
本文选择了一个月内所有工作日的傍晚高峰时段,从俄勒冈州阳光谷和约翰逊溪周围探测器收集的真实交通数据进行模型学习[12],并且这些数据由相应的模糊隶属函数处理。本文利用收集到的速度和占用率数据,根据本文的模型和建立的规则来预测匝道流量,并将其与实际数据进行比较。本节设计实验时会在将GA的超参数对于实验结果的影响纳入考虑范围内,以此找到最优超参数以优化模型性能。
GA超参数默认值将设为:种群大小
,交叉概率
,变异概率
,最大迭代次数
。控制其他变量不变,对种群大小、交叉概率和变异概率分别进行以下取值来进行实验:
1) 对于种群大小
,依次取值
。
2) 对于交叉概率
,依次取值
。
3) 对于变异概率
,依次取值
。
种群大小实验中,对于每个
将进行20次MAE和RMSE的测量,随后求取平均值,最终结果在表1中展示。
Table 1. Comparison of mean error precision for different population sizes
表1. 不同种群大小的平均误差精度比较
种群大小 |
MAE |
RMSE |
30 |
0.2790 |
0.4572 |
50 |
0.2748 |
0.4551 |
70 |
0.2734 |
0.4553 |
90 |
0.2725 |
0.4541 |
100 |
0.2719 |
0.4530 |
150 |
0.2712 |
0.4523 |
200 |
0.2707 |
0.4519 |
从表中结果可知,当
时,MAE和RMSE的值达到最大。而当
时,MAE和RMSE的值达到最小。这表明种群越小,结果越差,种群越大,结果可能会更好。
此外,从
、
到
的MAE值虽有下降但非常接近,考虑到更大的种群意味着更长的训练时间,均衡运算成本与模型效果,
可以视作当前实验的最优解。
交叉概率实验中,改变
从0.50到0.98来评估MAE和RMSE的误差精度,表2展示了20次运行后的平均测量结果。
Table 2. Comparison of mean error precision for different crossover probabilities
表2. 不同交叉概率的平均误差精度比较
种群大小 |
MAE |
RMSE |
0.50 |
0.2780 |
0.4608 |
0.60 |
0.2762 |
0.4551 |
0.70 |
0.2748 |
0.4553 |
0.80 |
0.2736 |
0.4541 |
0.90 |
0.2720 |
0.4530 |
0.95 |
0.2711 |
0.4523 |
0.98 |
0.2702 |
0.4519 |
从表中结果可知,随着
的增加,MAE值逐步下降,而当
时能够达到MAE最小值。由此可得,两个个体交叉概率的增加会让结果变得更好。
交叉概率实验中,
从0.001逐步增长到0.10,表3展示了MAE和RMSE的平均值。
Table 3. Comparison of mean error precision for different mutation probabilities
表3. 不同变异概率的平均误差精度比较
种群大小 |
MAE |
RMSE |
0.001 |
0.2759 |
0.4693 |
0.005 |
0.2722 |
0.4647 |
0.01 |
0.2711 |
0.4529 |
0.02 |
0.2718 |
0.4530 |
0.05 |
0.2726 |
0.4543 |
0.075 |
0.2738 |
0.4547 |
0.10 |
0.2752 |
0.4568 |
20次运行后获得的结果显示,起初随着
值的逐步上涨,MAE值呈现下降趋势,当
时,平均MAE精度到达最低的0.2818。然而当
继续增加,平均MAE和RMSE值都会增大。这证明了个体变异概率超出一定阈值后,结果可能会变差。
根据评估结果大致可以得出针对当前问题的最优GA参数。在此基础上继续进行不同函数链形式模型的学习性能评估。首先对采用默认GA参数的FLFPN模型进行训练,即设置种群大小
,交叉概率
,变异概率
,随后对采用了通过实验分析得到的最优GA参数的校准后的FLFPN模型进行训练,即设置种群大小
,交叉概率
,变异概率
。对以上两种模型分别进行20次独立的模型训练。由于初始权重的随机性,最终的误差会有一定程度的变化,采用箱型图记录完整的结果,见图6。
Figure 6. Effect of GA hyperparameter calibration on model performance
图6. GA超参数校准对模型性能的影响
箱形图中间线表示平均值,箱体的上下边界代表上下四分位数。从图中可知,对GA模型进行校准后模型的学习性能有了一个整体的提升,均值MAE = 0.2769下降至MAE = 0.2734。我们先前研究的实验表明,与传统的FPN模型相比,FLFPN对于匝道车流预测的准确率已有显著提高[9],而本文通过引入GA超参数的优化,使得模型学习性能在极低的运算成本下又获得进一步的提升。鉴于数据选择于高峰时段,即使是交通量的轻微变化也可能导致道路拥堵。因此,由于高速公路对拥堵的高度敏感性,即使是准确性的微小提升也是关键。这种流量预测准确性的提升对于避免匝道拥堵至关重要,因此关于超参数优化将作为今后对于FLFPN的学习算法深入探究的基础。
5. 结束语
本文构建了一个以FLFPN模型为核心的匝道控制系统,一方面,该系统发挥了FLFPN模型的自适应性优势:通过对过往真实数据的学习去训练模型参数,使模型可以通过不断学习和调整来提供更精确的交通流预测和控制判断,能使得研究成果具有长期价值;另一方面,该系统同样发挥了FLFPN模型的解释性优势:将模型推理和训练过程中得到的中间产物,即对各路段拥堵情况的分析,应用于对匝道整体控制的决策,以此实现了FLFPN模型价值的最大化。此外,本文探究了FLFPN模型学习算法中的一个环节——GA算法中超参数对于模型性能的影响,实验证明,通过调整GA参数能够在不改变整体学习算法的前提下对模型性能进行进一步提升,这一成果将作为未来继续探究FLFPN模型学习算法的基石。