一种基于个性的作战实体行为模型构建框架及方法
A Personality-Based Combat Behavior Modeling Architecture and Methods
DOI: 10.12677/AIRR.2019.84028, PDF, HTML, XML,  被引量 下载: 897  浏览: 2,323  国家自然科学基金支持
作者: 朱 江, 闻传花, 黄湘远:陆军指挥学院作战实验室,南京 江苏;陈 俊:陆军指挥学院研究生队,南京 江苏
关键词: 智能多Agent指挥控制决策模型Intelligence Multi-Agent Command & Control Decision Model
摘要: 作战实体建模面对作战中多样性和行为特点的互异性,需要刻画的行为变量众多、关系复杂,本文提出一种基于个性的作战实体行为建模方法,建立个性驱动行为生成概念框架,建立个性的表达、个性驱动的行动选择、个性的优化等子模型,并运用于指挥训练系统,为受训指挥员和机关人员构建形神兼备、公正逼真的模拟作战实体,较好地提升了训练效果。
Abstract: Combat entity modeling should face the problem of expressing behaviors with uncountable va-riables and relations under the complex combat environment, which has the characteristic of di-versity and heterogeneity. In this paper, firstly, a personality-driven behavior generation concept framework is constructed, then a personality-based combat behavior modeling method is proposed, which composed of personality expressing model, personality based behavior choosing model, personality optimizing model. As a result, it promotes the reliability and variety of behavior models, and can be used for command training system to acquire better training effect.
文章引用:朱江, 闻传花, 陈俊, 黄湘远. 一种基于个性的作战实体行为模型构建框架及方法[J]. 人工智能与机器人研究, 2019, 8(4): 248-254. https://doi.org/10.12677/AIRR.2019.84028

1. 引言

作战系统规模、层次和结构的复杂性,人、装备、系统交互中贯穿着人的主观因素和自觉目的,导致实体行为多样,且包含大量有意志、有目的和有学习能力的人的活动。实体行为建模,指的是“对虚拟环境中虚拟实体对象所遵循的行为规律的建模”。

行为建模面对作战中实体的多样性,和行为特点的互异性,需要刻画的行为变量众多、关系复杂,刻画行为不切实际和过分简单化,会导致虚拟兵力过于呆板和教条,不符合真实指挥员和战斗员的行为。行为建模难点在于行为既受到情境力量(外部力量)的控制,也受到个人品质(内在力量)的控制,难以通过简单规则推理得到。对于行为变量中的内在思维因素考虑不足,缺乏对心理个性的描述和计算模型,简单规则推理适应性不强,行为结果单一,难以反映个体行为差异表现,难以体现人对战术规律、战术原则的个性化运用 [1] [2] [3]。即使相对简单的机动决策行为,固定规则的方法,难以穷尽所有行为,模型也会抛出处理不了的异常,要由高度智慧的人处理。

本文为解决行为建模不真、不像的问题,提出一种基于个性的行为建模框架和方法。本文后续安排如下,首先研究行为产生原理和人的心理个性生成的机制,然后建立个性驱动行为生成的基本概念框架,接着围绕框架,说明个性建模的具体关键技术,最后简单说明模型的作用及效果。

2. 个性的基本机制

要刻画反映个性的指挥员和战斗员行为模型,首先要研究行为产生原理和人的心理个性生成的机制 [4]。美国心理学家卡特尔从个性与行为的关系角度认为,可以用个性预测一个人在给定的环境中的所作所为 [3] [4] [5]。英国心理学家米歇尔认为每个人有一套独特的心理表象,它使我们产生不同的行为模式,即使在相同的情境中,行为也会有所不同。米歇尔等人建构了认知–情感的个性系统(CAPS, Cognitive-Affective Personality System)理论,如图1所示。该理论认为人们遇到的事件会与个性系统中复杂的认知–情感单元(CAUs, Cognitive-Affective Units)发生交互作用,并最终决定人们的行为。

CAPS模型中的CAU是指所有的心理表征,系统中的认知–情感单元是一个关系组织系统中动态联结的组成部分。当个体处于某种情境时,个性系统中的这些单元就会与情境发生交互作用,并影响最后的行为。该理论认为,个体在不同情境下所表现出来的差异正是内部稳定而有机的个性结构的反映。个性单元在情境作用下以独特的方式联结在一起,形成个性结构,保持相对稳定。当某个个体处理某种情境中时,情境便会激活某些相互联系的单元,彼此之间又发生特定的交互作用,从而产生情境特异化的认识、情感和行为。不同的激活就是行为不一致的原因。

Figure 1. Behavior model of personality and cognition

图1. 个性和认知的行为模型

3. 概念框架

个性把个体的心理行为与物理行为联系在一起。物理行为即作战实体的OODA环过程,即实体感知环境的刺激(实体感知红外、声音、振动)和考虑赋予任务情境下(任务情境知识),然后做出分析判断到选择动作执行的过程。围绕这条主线,行为生成是按照个性驱动行为生成机制,包含“需要–动机–行为–效果”的内部过程,该框架是认知心理学的理论支柱。基于认知行为理论的OODA框架模型如图2所示。行为(Behavior)是指实体对于环境所表现出来的任何变化。行为有一个产生和结束的过程,在前一个行为结束后,在后续最大强度需要的作用下,可产生下一个行为。两个行为可以无缝链接,从而实现整个系统的有序循环。行为的基本单元是动作。动作选择与动作执行构成一个完整的行为过程。

Figure 2. OODA model based of behavior theory

图2. 基于行为理论的OODA模型

3.1. 行为动机

“动机”是行为的内在原因,是刺激和促发行为反应并为这种反应指明具体方向的内存力量。动机由需要与诱因共同产生。需要产生于实体对客观事物需求的主观反映。需要产生的内在条件是人格特质。作为一种可刺激实体的心理倾向,需要达到一定强度时则形成动机。诱因是指驱使个体产生一定行为的外部因素。动机在需要的基础上产生,但只有当诱因出现时,需要才被激活而成为内驱力,趋使个体趋向或接近目标,此时需要才转化为动机。目标是一种环境诱因,是个体期望的未来状态。个体对目标的认知,由外部诱因变成内部需要,形成行为动机,进而触发相应动作。实体的目标可源于自身需要,也可由上级赋予。

动机能提高实体对行为的理解和预测能力。行为主体根据行为动机选择具体的操作行为,“做”或“不做”。动机只决定行为主体是否要实施某种行为,不能决定行为主体是否能够实施该种行为,更不能决定行为主体怎样实施该种行为。一般情况下,动机会随着行为主体所处情境的变化发生改变,从而导致其行为变化。行为主体最终的行为选择可能是多个动机共同作用的结果。

3.2. 行为能力(动作)

行为主体的行为能力为该主体实施某一行为提供了可能性。操作行为选择后,需要具体的操作行为能力才能真正实现行为的执行,才使外显行为真正发生。行为选择与行为执行构成一个完整的行为过程。其中,行为的选择由动机决定,行为的执行与动机无关。行为主体能够真正实施某一行为的关键是其能否具备相应的行为能力。

从行为的全过程看,动机和能力是行为的两个决定性因素。动机决定了行为的选择,反映了行为发生的必要性,同时也体现了行为的目的性。操作能力主导了行为的执行过程,反映了行为发生的可能性。其中,能力是相对的,一般可用相对的大小或者强弱来描述能力之间的相对关系。对于行为主体而言,与动机相比,行为能力是相对客观的因素,但行为能力是可变的,既可增强也可减弱、甚至消退。与动机的变化相比,行为能力的变化过程相对较长,换而言之,就某一次行为过程而言,其行为能力相对稳定。

多个动机可以共同作用促使行为的发生。同样,行为的执行通常依赖多个能力因素。比如,战场上战士追击敌人,需要具备观察能力、机动能力和打击能力等,缺一不可。动机与能力之间并不彼此独立,通常情况下,这两者之间可以相互影响,动机的强弱会受认知能力大小的影响,同样,认知能力的大小亦会受到动机强弱的影响。

动作(Act)是具有一定动机和目的并指向一定客体的运动系统。动作是活动的组成部分,通过运动来实现的。它是以自觉的目的为特征,并且总是以一定的动机所激发。实体动作是实体能够做出的最小的具体行为,一般由人力或自然力产生一个事件,从而引起实体状态的变更或转换。动作是指实体所具备的能力或功能属性,是不可分或不必要再分的最基本和最底层的行为要素。

3.3. 行为效果

行为结果来自实体在环境中执行的所有动作。这些动作是实体为了完成它的目标而从其能力中选择的。“效果”是行为产生的有效结果。这个结果又会影响行为,产生适应环境的演化。若行为效果满足需要,实体又会产生新的需要,从而产生新的行为;若未满足,则仍会继续规划行为,直到满足需要为止。

产生效果后,实体会进行归因分析。归因是对行为进行分析,推论出这些行为的原因的过程。从归因的角度看,动机是特殊的、认知的、习得的、也对内部外部线索有所响应。归因是人们对自己或他人活动及其结果的原因所做出的解释和评价。动机归因理论认为动机是思维的功能,采取因果关系推论的方法从人们行为中寻求行为内在的动力因素。积极的归因是把成功归因于能力,把失败归因于努力不够。人们往往把自己的成功与失败归结为所述四个原因中的一个或几个,归结为不同原因会带来相应的心理变化,表现为对下一次成就结果的期待与情感的变化,进而影响以后的成就行为。

4. 行为模型构建关键技术

作战行为建模难点在于人类行为表示,其含义是指用计算公式\程序或某种模拟方法来表示个人与组织的行为 [5] [6] [7]。基于个性的行为建模,结合概念框架,要对“需要”的人格特质进行分析,构建个性的表达模型;对“动机”进行分析,构建个性驱动的行为模型、行为的优化模型。

4.1. 个性的表达模型

个性始终围绕某些个性因子进行,即这些个性因子直接(或间接)影响(或决定)着该部分个体的个性。个性建模主要是将个性抽象成由若干个性因素(指标)表示,并辅以一定的权重衡量。

当前最著名的人格特质理论(简称个性)是OCEAN模型,如图3所示,即开放性(Openness)、尽责性(Conscientiousness)、外倾性(Extroversion)、随和性(Agreeableness)和情绪稳定性(Neuroticism)等。从这五个方面遴选在作战中指挥员和作战人员应具备的气质和性格特点,比如大胆的程度、服从命令的期望、谨慎的程度、对待友军的态度、对待战友的忠诚度、对待逆境的态度等。

Figure 3. Factor affected personality

图3. 影响个性的因素

复杂适应系统中的智能体具有自治性、主动性、社会性 [8] [9] [10],就像一个真实的人,可以说具有丰富的个性,而在心理战中,指挥员同样具有丰富的个性,我们需要做的是将指挥员的个性映射到智能体的个性上。另外智能体还会考虑另外一些诱因,比如到某地形的乐意程度、维持地形的乐意程度、喜欢或避开植被的程度、喜欢或避开水的程度等。

4.2. 个性驱动的动作选择模型

行动实体在面对环境的多种可能性时,其行为选择表现为动作选择。动作选择模型,描述行动实体如何产生射击、机动、防护、装载等动作的模型。

模型实现流程如图4所示。其中模型的输入来自环境感知模型输出的环境信息和作为人的需要。个性模型根据环境产生需要集,情境特征根据目标产生诱因,最终共同形成动机集,处理时通过个性+规则驱动动作选择,表示为If实体具有某一个性,当满足某类条件(规则)时,Then执行具有某动作的动机。

Figure 4. Act choosing model driven by personality

图4. 个性驱动的动作选择模型

动机模型获取候选动机集后,在记忆库查找历史记录,获取相同的状态时,即可得到的候选动机集;如果在记忆库中没有查找到,则在知识库中查找个性特征和动机的对应关系。接着对候选动机集中的每一个动机,首先在记忆库中查找动机分解;如果没有查找到,则在知识库中查找;最后对于获取的每一个动机分解进行评价,从而获得当前动机,输出给外部的动作选择模块,选择完成的射击、机动、防护、装载等动作。

4.3. 基于遗传算法的行为优化模型

人的个性很大程度是由遗传决定的,而按照“适者生存”和“优生劣汰”的原理,遗传就是一个适应环境的自然选择和生物进化过程。因此自然考虑用模拟此过程的遗传算法来对行为进行优化(图5) [11]。

遗传算法起源于60年代,由美国Holland教授提出,是从代表问题可能潜在解集合的种群开始(一个种群由经过基因编码的个体组成),种群迭代演化到越来越好的近似最优解。

Figure 5. Behavior optimizing model by GA

图5. 基于遗传算法的行为优化模型

基于遗传算法的行为优化过程包括:

1) 编码:将行为个性编码为像人体DNA的“基因”一样,每一基因对应的是个性表达的参数,运用可变长基因组合就可以代表一定的行为,如图6所示。比如突破时的一个战术动作,涉及“趋向敌人的个性,保持友方距离的个性,沿着遮蔽度高的地形的个性”三个基因构成的变长基因组合,其含义是“实体要尽量趋向敌军、保持一定间隔距离降低被打击伤亡率,延遮蔽度高的地形降低发现率”。

Figure 6. Variable gene code for behavior

图6. 行为的可变长基因编码

2) 群体生成。就是通过输入已知战术动作对应的个性基因编码,作为第一代输入。当系统中各种行为都编码后,就是一组基因的群体。

3) 适应度计算。将适应度表示为敌我方损伤、消耗、效益、风险等的函数,进而作为衡量基因适应环境的程度。

4) 遗传操作(选择\交叉\变异)。实验平台中进行推演,每推演一次后,对基因进行交叉变异,形成新的基因编码。

5) 进入下一代这几个步骤。再进行推演,根据适应度选择更有利的基因编码,得到更好的个性和对应的行动,达到优化战术的目的。

5. 小结

本文提出一种基于个性的作战实体行为建模方法,建立个性驱动行为生成概念框架,建立个性的表达、个性驱动的行动选择、个性的优化等子模型,并应用于构建高度智能化的计算机仿真实体,提高了模型的可信度和丰富度。这些模型在指挥训练系统中加以使用,能够根据不同方向的使命任务,不同级别受训人员的需要,为受训指挥员和机关人员构建形神兼备、公正逼真的模拟蓝军,让受训人员在贴近实战的虚拟环境中进行高强度、高难度的对抗,起到很好的磨刀石效果,较好地提升了训练效果,减少了组织成本。

基金项目

国家自然科学基金71401177资助。

参考文献

[1] Vakas, D., et al. (2001) Commander Behavior and Course of Action Selection in JWARS. Proceedings of the 10th CGF&BR Conference, Norfolk, 14-17 May, 147-154.
[2] Strofky, M., Hogan, C. and Prince, J. (2003) A Common Architecture for Behavior and Cognitive Modeling. 2003 Conference on Behavior Representation in Modeling and Simulation, Scottsdale, 12-15 May, 210-217.
[3] 陈亚洲, 刘建平, 包战. 基于认知主导决策模型的陆军合同战术指挥员Agent建模策略. 系统仿真技术, 2013, 9(1): 66-70.
[4] Turkia, M. (2009) A Computational Model of Af-fects. In: Dietrich, D., Fodor, G., Zucker, G. and Bruckner, D., Eds., Simulating the Mind, Springer, Germany, 277-289.
https://doi.org/10.1007/978-3-211-09451-8_11
[5] Barteneva, D., Lau, N. and Reis, L.P. (2008) A Computa-tional Study on Emotions and Temperament in Multi-Agent System.
http://arxiv.org/abs/0809.4784
[6] Slater, S., Moreton, R., Buckley, K. and Bridges, A. (2008) A Review of Agent Emotion Architectures.
http://www.eludamos.org/index.php/eludamos/article/viewArticle/44
[7] Becker, C., Lessmann, N., Kopp, S. and Wachsmuth, I. (2006) Connecting Feelings and Thoughts-Modeling the Interaction of Emotion and Cognition in Embodied Agents. Proceedings of Seventh International Conference on Cognitive Modeling, Ann Arbor, MI, 6 August, 32-37.
[8] 胡记文, 尹全军, 冯磊, 邓海军, 查亚兵. 基于前景理论的CGF Agent决策建模研究. 国防科技大学学报, 2010, 32(4): 131-136.
[9] 冯进, 朱江, 沈涛林. 一种基于分层智能混合决策的多Agent框架. 火力与指挥控制, 2017(1): 36-40.
[10] Costantini, S., Tocchio, A., Toni, F., et al. (2007) A multi-Layered General Agent Model. In: Basili, R. and Pazienza, M.T., Eds., Artificial Intelligence and Human-Oriented Computing, Springer, Berlin, Heidelberg, 121-132.
https://doi.org/10.1007/978-3-540-74782-6_12
[11] 韩月敏, 林燕, 刘非平, 等. 陆战Agent学习机理模型研究. 指挥控制与仿真, 2010, 32(1): 13-17.