1. 引言
共享经济是指拥有闲置的资源的人通过有偿的方式将资源共享给需要的人。在交易过程中,提供者的资产可能被盗或者被损坏,消费者可能得不到所对应价值的物品。因此,想要交易顺利进行,就要求消费者和提供者之间彼此信任对方的行为 [1] 。信任和互惠作为人类行为的一个基本要素而存在 [2] ,现实生活中各个方面都有他们的身影,包括制度管理 [3] 、社区服务 [4] 、社会关系 [5] 、人类协助 [6] 、家庭共享 [7] 、共享平台 [8] 等。Nowak和May首次发现空间互惠能够有效促进合作的演化 [9] 。我们先把个体的历史行为记录在声誉中,然后用个人声誉来建立信用体系为社会提供重要信息。Nowak和Sigmund [10] 在一个间接互惠模型中引入了声誉的概念,发现个体声誉对合作有很大的影响。
信任的重要性已经在各个领域引起了学者们的广泛关注,包括行为科学 [11] ,心理学 [12] ,数学 [13] ,社会学 [14] ,神经科学 [15] ,人工智能 [16] 等。经典博弈模型,如囚徒困境博弈(PDG) [17] ,公共物品博弈(PGG) [18] ,雪堆博弈 [19] 等已经有大量的学者进行研究,但是信任博弈目前少有人关注。
想要电子商务交易达成,消费者必须对提供者是信任的。信任可以与电子商务消费者行为联系起来 [20] ,对经济有潜在的贡献 [21] 。在共享经济中,消费者对提供者的信任要求更高。提供者共享的身份信息,可以加强共享经济中的信任 [22] 。消费者对提供者的信任是影响社会满意度水平的重要因素 [23] 。Hawlitschek [24] 认为同行之间的信任在几乎所有共享经济互动中都扮演着至关重要且复杂的角色。在共享经济下,拥有权和使用权可以分别属于不同的人。传统电子商务交易中所有权由提供者转移到消费者中,共享经济中所有者一直属于提供者,只是使用权转移。提供者遇到不可信的消费者时,收到的损失会很大。这说明信任在共享经济中尤其重要。
声誉与人的生活息息相关,一个声誉不好的人往往得不到别人的合作,人们更容易发现声誉好的人,且更愿意模仿他的行为和与他合作。许多学者在声誉对演化博弈的各方面影响进行了研究,如基于声誉的投资策略 [25] ,引入延迟信息 [26] ,声誉的不确定性 [27] ,声誉对收益 [28] ,对更新规则 [29] 的影响等。也有学者研究声誉对空间公共产品博弈 [30] 和囚犯困境博弈 [31] 的影响。Quan等 [32] 研究了具有容忍度的声誉评价和依赖声誉的选择模仿对合作的影响,并得出声誉有利于合作的长期生存的结论。因此,声誉机制作为一种与间接互惠相关的共同规则,可能在信任博弈中发挥促进信任的作用。
本文以复杂网络为载体,以演化博弈理论(EGT)为框架,以声誉机制为研究对象,研究共享经济中信任的演化。与Chiong等人 [33] 的模型一样,在我们的信任模型中,玩家有四种可能的策略:成为可信提供者(TP)、成为不可信提供者(UP)、成为可信消费者(TC)和成为不可信消费者(UC)。考虑到分析具有四种可能类型的参与者的种群的进化动力学的复杂性,我们选择基于代理的建模方法 [34] 。基于Agent的建模是一种将种群中的个体用Agent表示的计算方法。每个代理人都有机会根据一套严格的规则自主行动。
本文的其余部分安排如下:第二部分介绍了基于声誉与收益相结合的共享经济信任模型。第三部分给出了仿真实验,并对模拟结果进行了详细的分析和讨论。最后,第四部分对全文进行总结,并对未来的工作进行展望。
2. 模型构建
2.1. 博弈模型与支付矩阵
共享经济的信任博弈模型是在具有周期性边界方格子网络中进行的,方格子网络是一种常见的规则网络模型,其特点是网络中节点的位置形成了方格状,每个节点有上下左右四个邻居,而且相邻节点之间的欧几里得距离相等,为了保证网络的延拓性,我们把最上一列的节点与最下一列的节点相连,把最左一列的节点与最右一列的节点相连,具体如下图1所示。
![](//html.hanspub.org/file/9-1701472x7_hanspub.png?20240409094700397)
Figure 1. Square lattice network with periodic boundary
图1. 具有周期性边界的方格子网络
在互动过程中,每个参与者占据网络中的一个节点,并通过网络的连边与周围的邻居进行交互。每个参与者可以从以下四种策略中选择一种:
1) TP:值得信任的提供者,按照承诺提供相应的服务与产品;
2) UP:不值得信任的提供者,提供的服务水平和产品质量比之前承诺的要低得多;
3) TC:值得信任的消费者,以适当的方式使用提供者提供的产品;
4) UC:不可信任的消费者,以不适当的方式(例如故意损坏或盗窃等)使用提供者提供的产品。
每个参与者在确定好自己的策略后,与自己的邻居进行博弈,未加入声誉时提供者和消费者的收益矩阵我们用下面的表1来表示,本文中,我们引入声誉机制,加入声誉时提供者和消费者的收益矩阵我们用下面的表2来表示。
其中,B是提供者和消费者都可信时的收入,S是提供者可信任时遇到不可信任的消费者所支出的成本,Temp是可信任的提供者对不可信任消费者的诱惑,X是消费者遇到不可信提供者时所支付的价值。如果两个参与者同时选择提供者或者消费者,则两者收益均为0。
在这里,选择可信任代表着合作,选择不可信任代表着背叛。该博弈矩阵是一种处于社会困境的情境,每个参与者都有偏离最初约定的动机。存在一个不稳定的帕累托最优,使得双方都获得 的收益。如果消费者选择背叛可信任的提供者,则可信任的提供者会得到−S的惩罚,不可信任的消费者会有Temp的收入。如果提供者选择背叛可信任的消费者,则可信任的消费者会有−X的惩罚,不可信任的提供者会得到 的收入。这说明不可信任的参与者可以利用可信任的参与者,使背叛策略要优于合作策略。
![](Images/Table_Tmp.jpg)
Table 1. Payoffs in the sharing economy trust game (without adding reputation mechanisms)
表1. 未加入声誉机制时提供者和消费者的收益矩阵
![](Images/Table_Tmp.jpg)
Table 2. Payoffs in the sharing economy trust game (adding reputation mechanisms)
表2. 加入声誉机制时提供者和消费者的收益矩阵
其中,R是个体的声誉,用于反映个体在博弈中的历史行为,具体定义会在下一节给出。所有代理的总收益计算如下:
(1)
其中N是群体中代理的总数;
是焦点代理i的收益,通过将其与其他代理的所有交互的回报值相加来计算,如下所示:
(2)
其中,
、
、
和
分别是焦点代理i的交互中值得信赖的消费者、值得信赖的提供者、不值得信赖的消费者和不值得信任的提供者的数量。类似地,
是焦点代理i的策略。
由于交易产生的潜在损害通常通过保险(对于消费者和供应商)来减轻,降低了与不可信的同行互动的成本,因此在本研究中我们将S和X的值设置为小于B。支付参数的相对值用以下规则描述:
.
2.2. 声誉的演化更新
我们引入声誉的概念来记录个人在共享经济信任博弈中的历史行为。声誉值为动态的并且根据某些规则在游戏的过程中不断更新。代理人在时间步长
的声誉值取决于其在时间步长t的策略。在演化过程中,每个人的声誉更新规则如下。如果一个玩家配合,他的声誉将增加0.2个单位。相反,如果他选择背叛,他的声誉将减少0.2个单位。设
表示玩家 在时间 的声誉值,因此,玩家i的声誉的更新过程可以被描述为
(3)
其中
是玩家i在时间t的策略。特别是,在不失一般性的情况下,我们尽量将声誉保持在合理的范围内。我们在模拟中设置声誉的边界条件,该边界条件在0到5之间,即
。当玩家的声誉超过5时,他的声誉被设置为5。类似地,如果玩家的声誉低于0,则他的声誉被设置为0。最初,在区间
中为每个个体分配一个随机声誉值。
2.3. 策略的演化更新
在整个模拟过程中的每个时间步骤t,代理都有机会更新其策略。每个中心代理将同步决定是否模仿其直接邻居的策略,这确保了每个代理在固定步骤上的决策不受其他代理的影响。
在本研究中,我们选取费米规则作为策略的更新规则。具体来说,每个时间步随机选择一个玩家(记为i)来更新自己的策略。然后,玩家i以等概率从他的四个邻居中随机选择一个邻居(记为j),并以一定的概率模仿他的策略。模仿概率由基于玩家i和玩家j收益差异的费米函数决定,这使得高收益策略更容易被复制。具体来说,玩家 模仿随机选择的邻居j的概率为
(4)
和
分别是玩家i和j的累积收益;k是噪声参数,它代表着玩家在策略选择过程中的不确定程度,当
时,若玩家j有更高的回报,玩家i会模仿玩家j的策略,若玩家j有更低的回报,玩家i不会模仿玩家j的策略,若玩家j的回报与玩家i相等,玩家i以二分之一的概率模仿玩家j的策略。
代表以二分之一的概率模仿,不考虑玩家j的回报。在没有特殊说明的情况下,我们在本研究中设置
。
3. 数值模拟仿真实验
3.1. 蒙特卡洛方法
本文考虑使用蒙特卡洛方法进行模拟,蒙特卡洛方法是一种通过计算机产生随机数来解决实际问题的一种概率统计方法,主要包括以下几个关键步骤:
第1步:模型和策略的设置。构建共享经济博弈模型、搭建具有周期性边界的方格子网络,提出声誉更新规则和策略更新规则。
第2步:各参数的初始化。网络的边长、初始种群比例、各参与者的策略和收益等。
第3步:博弈开始。遍历网络中的所有节点,使得当前节点与周围的四个邻居分别进行博弈并计算当前节点的收益之和。
第4步:策略更新。博弈完成后,每个节点按照给定规则同时进行策略更新和声誉更新。
第5步:记录参数变化。每个节点的收益、声誉及策略变化,每类参与者的数量变化等。
第6步:重复第2步到第5步,直到整个系统趋于稳定。每类策略的参与者数量稳定,系统的总收益收敛到某一点。
第7步:实验结果分析。整理实验结果绘制相关图表等并进行详细分析。
3.2. 数值模拟数据说明
本文在蒙特卡洛模拟中设定方格子网络的边长L = 100,共有10,000个代理。最初,合作者和背叛者以提前设定好的概率分布在网络上。下面报告中的每个数据都是在系统达到演化稳定后,一般为10,000个蒙特卡罗步骤(Monte Carlo Step, MCS),通过平均最后1000个时间步长(即最后10%)来计算报告的结果。所有结果均通过10次独立的蒙特卡洛实验取平均值得到,以保证数值结果的准确性和稳定性。在每个时间步骤中,每个代理与其他直接连接的代理重复的进行博弈,并独立的决定是否改变自己的策略。为了与文献 [35] 中的典型结果对比,本文设定
。
本文通过设置不同的
和
的值,模拟了如下初始种群条件的五种不同场景,这些值决定了初始玩家的策略TP、UP、TC、UC的数量:
场景1:不同类型的玩家比例相等
。
场景2:消费者多,提供者少
。
场景3:提供者多,消费者少
。
场景4:不可信任者多,可信任者少
。
场景5:可信任者多,不可信任者少
。
N是总玩家的数量。
3.3. 模拟结果分析
图2~图6分别展示了在五种不同的博弈场景下,玩家比例的演化和整个系统的总收益演化过程,仿真结果显示信任水平要高于文献 [35] 中的研究结果。
从图中可以观察到,在情境1、2和4中,各类玩家的比例随时间的演化和最终稳定后的数量都表现出一致,UP的占比随着时间的推移逐渐增加,然后经过少数几个时间步,逐渐降低,最后灭绝了;UC的占比随着时间的推移逐渐减少直至灭绝;TP和TC的占比随着时间的推移先有一个很小幅度的下降,然后迅速提高,最后动态稳定下来,并且以各占一半的比例占据整个市场。
在情境3中,TP的占比随着时间的推移逐渐下降,然后经过少数几个时间步,逐渐提高,最终动态稳定下来;UP和UC的占比与TP相反,随着时间的推移先有一个小幅度的增加,然后迅速降低,最终动态稳定下来;TC的占比则是随着时间的推移逐渐增加直至动态稳定。最终稳定的市场中 和 占比接近各约35%,UP和UC的占比接近各约15%。
在情境5中,UC的占比随着时间的推移先有一个小幅度的增加,然后迅速降低,最终动态稳定下来;TP和TC的占比与UC相反,随着时间的推移先逐渐下降,然后经过少数几个时间步,逐渐提高,最终动态稳定下来;UP的占比则是先有少数几个时间步的不变,待UC的占比增到顶峰准备下降的时候再开始突然增加,然后迅速降低,最终动态稳定下来;最终稳定的市场中TP和TC占比接近各约40%,UP和UC的占比接近各约10%,与情境3的状态类似。
出现上述观察结果的原因如下。对于情境1、2和4,在演化初期,UC的占比较高,为了保证收益,提供者会更倾向于采取不信任的策略,这导致从
到
时UP的数量迅速增加,此时UP的声誉值会相对较低,根据收益与声誉结合的方法,再继续采取该策略将不是最优,从而在后期转向可信任的策略,UP的数量便会下降,TP和TC的数量又会相应增多。对于情境3和5,在演化初期,TP的占比较
![](//html.hanspub.org/file/9-1701472x39_hanspub.png?20240409094700397)
Figure 2. The evolution of the player proportion and the total revenue of the whole system under Scenario 1
图2. 场景1玩家比例随时间的演化和整个系统的总收益演化过程
![](//html.hanspub.org/file/9-1701472x40_hanspub.png?20240409094700397)
Figure 3. The evolution of the player proportion and the total revenue of the whole system under Scenario 2
图3. 场景2玩家比例随时间的演化和整个系统的总收益演化过程
![](//html.hanspub.org/file/9-1701472x41_hanspub.png?20240409094700397)
Figure 4. The evolution of the player proportion and the total revenue of the whole system under Scenario 3
图4. 场景3玩家比例随时间的演化和整个系统的总收益演化过程
![](//html.hanspub.org/file/9-1701472x42_hanspub.png?20240409094700397)
Figure 5. The evolution of the player proportion and the total revenue of the whole system under Scenario 4
图5. 场景4玩家比例随时间的演化和整个系统的总收益演化过程
![](//html.hanspub.org/file/9-1701472x43_hanspub.png?20240409094700397)
Figure 6. The evolution of the player proportion and the total revenue of the whole system under Scenario 5
图6. 场景5玩家比例随时间的演化和整个系统的总收益演化过程
高,为了保证收益,消费者会更倾向于采取不信任的策略,这导致从
到
时UC的数量迅速增加,此时UC的声誉值会相对较低,根据收益与声誉结合的方法,再继续采取该策略将不是最优,从而在后期转向可信任的策略,UC的数量便会下降,TP和TC的数量又会相应增多。
同时我们注意到一个反常的现象,在情境1、2和4中 的占比较高,在情境3和5中TP占比较高,本以为初始种群中值得信任者多时最终稳定状态也会值得信任者更多,结果却相反。这可能是因为当初始种群中有大量的值得信任的参与者时,不值得信任的参与者会利用规则欺骗值得信任的参与者而保留到最后。
4. 小结
本文提出了一种新的基于第三方声誉评价的共享经济信任博弈模型,以促进群体内信任行为的演化。在共享经济的信任博弈模型中,每个参与者通过网络的连边与周围的邻居进行交互。在互动过程中,每个参与者可以从四种策略中选择一种。
通过不同初始种群分布的实验,我们发现,声誉可以形成信任,即使初始种群拥有有限的可信玩家(例如,只有10%),信任策略也可以占优。本研究部分证实了文献 [35] 的研究结果,即不可信的消费者不占主导地位,即使是在初始状态不可信的消费者占比很多的情况下。仔细分析可以发现,不可信的消费者在利用可信任的提供者的同时,他们也会受到不可信提供者的“惩罚”。相反,可信任的提供者和消费者可以很容易的形成合作关系,共同抵御不可信者的入侵。这就说明,相互信任是非常重要的。
在原本由不可信提供者占据主体的市场中,声誉的引入会促使可信任提供者的出现,因为不可信提供者的声誉往往会更低,就得不到其他人的合作,可信任的提供者又会进一步的促使可信任的消费者出现,这就是基于声誉机制起到的作用,在共享经济中使信任度更高。
本研究可以给市场上的共享经济提供指导意见,针对不同地区会有不同的初始参与者类似于本研究中的5种不同情境,政府可以通过监督参与者的声誉,提出政策把声誉与收益结合,来促进信任的产生和维持,使社会变得更加和谐。
虽然本研究的重点是基于声誉与收益结合,但我们的未来工作将进一步研究声誉的其他引入方式,譬如声誉的延迟效应。这意味着给个体一个反应时间,而不是立刻更改声誉,这会减少一部分因为误做决策而引起的误差。
致谢
由衷地感谢国家自然科学基金资助项目等的资助。
基金项目
国家自然科学基金资助项目(11901068, 11861026, 12361064);湖北省冶金工业过程系统科学重点实验室开放基金项目Z202301;广西自然科学基金(2021GXNSFAA 220034);重庆市自然科学基金面上项目(No. CSTB2022NSCQ-MSX0606)。