1. 引言
大数据和人工智能等新一代信息技术的发展使得越来越多的企业通过推荐算法向目标用户投放广告 [1] ,这种营销行为高效、精准,但也带来了用户隐私泄露、信息窄化、算法歧视等新的社会问题。为应对这一问题,现有研究大多从“法律”和“技术”两个角度展开研究。
国家出台了一系列管理规定,如《互联网信息服务算法推荐管理规定》,对信息服务规范和用户权益保护等做了一系列规定。一些学者也对推荐算法中的技术进行了分析,尝试对数据内容进行脱敏、去标识化、匿名化等处理来提高安全性。但在实践中,这些应对方法的成本较高,治理效果较弱 [2] 。随着人们逐渐意识到算法规范的重要性,社会、平台、用户联合展开行动,基于新公共治理理论建立一个以行业为核心,专家协会为重点,广告主体为基础,政府和公众为辅助,多方参与的治理体系 [2] ,但在实际运作中仍存在诸多问题,如不合理的组织结构、企业加入的动力不足等,在实践中未展开较好的应用。
协同治理作为公共事务治理的新范式,能够创造条件保障社会秩序和集体行动 [3] ,在网络信息、社会组织等治理方面已经展开了广泛的应用 [4] 。徐琳等在对网络信息协同治理的研究中,得出了“主体–方法–运行机制”三维式治理模式 [5] ;许风等通过研究得出互联网治理效果的提高需要政府和网民协同合作 [6] 。推荐算法作为一种技术知识,具有不可解释和不透明的特点,协同治理在该领域内的应用模式研究还比较缺乏,并且由于算法技术的特殊性,对于非专家群体而言,试图对算法进行监管的可操作性不高,由此,积极推进行业自律建设是一种解决办法 [7] 。但是互联网的发展日新月异,庞大的社交媒体用户群体多样化的需求也逼迫着推荐算法的升级迭代。联盟被认为是提升生产力、促进创新的一种重要组织形式 [8] ,同时,价值共创作为近几年的研究热点,在知识共享 [9] 、平台企业创新多主体参与 [10] 方面均有良好的应用。基于算法治理与优化的双重目的,拟构建由核心企业主导的推荐算法联盟。对于互联网企业来说,信息技术能力是竞争优势的重要来源 [2] ,算法规范更强的企业必会将这种技术优势视为自己的核心竞争力之一,选择与其他企业进行合作意味着企业会丧失一部分自主权。因此,“推荐算法联盟怎样建立、健全才能促进本身的发展?对于掌握推荐算法技术的企业来说,又该如何衡量是否参与合作的抉择?加入后的企业基于怎样的机制互动才能促进推荐算法技术资源的整合及重构,获得最大利益?”是需要重点讨论的几大问题。
基于此,通过借鉴标准技术联盟、竞争情报联盟等组织的运行机制,从协同治理的角度出发,基于价值共创的视角,讨论推荐算法联盟运行的一般模式,并就如何提高企业的参与程度,分析了在有无动力机制两种状态下,双方各自的能力水平、价值共创参与成本、价值共创的额外收益及分配比例 [11] 、政府的奖励与惩罚以及双方违约成本的影响,重点研究企业参与算法规制问题的动力机制。
2. 问题与模型描述
基于协同治理与价值共创的目的,参与主体之间进行有效交流合作,能促进资源整合及重构 [12] 。以协同治理为出发点,建立的推荐算法联盟作为第三方社会组织获得赋权,不仅能减轻政府的行政压力,也能规避权力过于集中产生的专制、决策倾向性等问题,有利于提升专业组织自我管理的积极性。学者们对多主体协同的运行模式进行了不少研究;张亚男、王克平等基于区块链思维对竞争情报联盟的运行机制进行分析 [13] ;蔡猷花、孟秋语 [14] 等利用动态惩罚机制来探究众创空间运营方企业和入驻企业合作创新的影响因素。参考平台监管、竞争情报联盟以及众创空间等组织的运营模式,对推荐算法联盟的机制进行了分析。
Fenwick等 [15] 、Leoni和Parker [16] 指出平台在市场活动中可充当“管理者”的角色,因此核心平台企业作为运营方企业发挥资源优势及监管作用 [17] ,与入驻企业通过契约机制相互监管,政府为辅助,通过监管奖励机制为推荐算法联盟的运行提供监督,这是联盟的动力机制,也是联盟运行的核心机制;实现算法技术资源优化共享及算法执行过程中的审查和监督是企业间建立推荐算法联盟的意义所在,其包含了联盟算法技术收集、技术共享、监督与治理等关键过程,此为联盟的协作机制。而保障机制为推荐算法联盟资源的共享提供了安全、可信的环境,保障推荐算法联盟循环往复运行,不断推进,运行机制及具体内容如表1所示。
![](Images/Table_Tmp.jpg)
Table 1. Operation mechanism and specific content of recommendation algorithm alliance
表1. 推荐算法联盟的运行机制及具体内容
推荐算法联盟运营方企业与入驻企业在各个机制的作用下相互约束,通过资源整合实现合作优化 [18] ,但在实践中,类似的联盟并不是所有的企业都愿意加入。如主导数字视/音频制定压缩技术研发的朗讯就没有参加负责该技术的专业联盟 [19] ;拥有许多关键通信技术的苹果公司,拒绝加入该技术组织联盟。因此,联盟建立后,重点讨论企业加入的动力机制问题。入驻企业可以根据自己的利益来决定是否合作,运营方企业也可以选择是否与入驻企业进行推荐算法共享进而实现价值共创,双方在价值共创的过程中也会根据对方策略的变化来动态调整自己的策略。因此参照相关研究提出如下假设:
假设1:在推荐算法联盟中有运营方企业和入驻企业两大主体,双方本着价值共创的目的,在进推荐算法优化交流的同时,也防止对方在使用推荐算法时过度采集用户信息,双方有着相互监督的责任,同时运营方企业还需要对联盟进行管理 [20] 。
假设2:博弈双方主体之间的信息具有不对称性,在博弈初期往往无法做出最优决定。但双方均是有限理性的,在达到最优状态之前,双方会不断根据变化动态的调整自己的策略。
假设3:推荐算法联盟运营方企业和入驻企业均可采取“合作”或“不合作”两种策略。“合作”策略意味着双方基于价值共创的目的加入算法联盟,且付出全部实力,使其共同利益最大化;如果双方都选择“合作”策略,价值共创能够给双方带来额外收益 [12] 。而“不合作”指双方为追求自身利益的最大化,不加入联盟或者加入联盟后存在投机行为,不付出自己的应尽的义务,坐享其成,甚至做出损害联盟利益的行为。
假设4:在博弈开始时,运营方企业选择“合作”的概率为x (
),选择“不合作”的概率为1 − x;入驻企业选择“合作”的概率为y (
),选择“不合作”的概率为1 − y。
3. 符号说明
3.1. 关于成本
为保证推荐算法联盟的正常运行,运营方企业和入驻企业均需要付出相应的成本。若双方均参与价值共创系统,需要付出的总成本为C (C > 0),两者分担比例分别为
(
)和
。运营方企业和入驻企业的算法优化过程实质上也是一个知识交流分享的过程,商淑秀和张再生 [21] 在对知识共享的研究中发现,虚拟企业的收益取决于分享知识企业的水平以及自身对知识的转化和吸收。所以,假设
、
分别为运营方企业和入驻企业自身的能力水平,
、
分别为运营方企业和入驻企业的参与成本系数。则运营方企业和入驻企业分别有合作意愿时,需要付出的成本分别为
、
。
3.2. 关于收益
推荐算法联盟内各主体通过合作实现各自的价值,假设
、
分别为运营方企业和入驻企业用户将对方的努力转化为自身收益的水平系数,则
为入驻企业合作的情况下运营方企业的收益,
为运营方企业合作的情况下,入驻企业获得的收益。此外,价值共创的最大意义在于帮助各个参与主体在实现自身利益最大化的同时,获取一定的额外报酬。若推荐算法联盟运营方企业与入驻企业以价值共创为出发点,均选择“合作”策略,就可以通过资源整合与合作获得额外收益。据此,假设运营方企业的基本收益为
(
),入驻企业的基本收益为
(
),二者通过合作所创造的价值共创额外收益为R (R > 0) [22] ,
(
)
为运营方企业的分配系数
,为入驻企业的分配系数。
3.3. 关于动力
政府作为该联盟的组织者与监管者,应审核联盟制定的绩效考核标准,并通过动力机制进行管理,如果推荐算法联盟运营方企业不能承担相应的监管责任,政府将对联盟运营方企业做出惩罚,记为F (F > 0),为惩罚机制;如果运营方企业尽职尽责,政府便可给予运营方企业相应的奖励金,记为E (E > 0),为奖励机制。此外,推荐算法作为一种技术知识,为了规避双方的投机行为,推荐算法联盟的运营方企业和入驻企业之间建立了一定的规则,如果在合作过程中发现任何一方存在投机行为,则要支付部分罚金,记为f (f > 0)。综上,符号模型及含义见表2。
![](Images/Table_Tmp.jpg)
Table 2. Model number model and its meaning
表2. 模号模型及含义
4. 无动力机制时的演化博弈模型
4.1. 模型演化稳定策略
在以上假设的基础上,若不考虑动力机制,依靠联盟自身的运营构建的运营方企业和入驻企业合作的博弈收益矩阵如下表3。
(1) 推荐算法联盟运营方企业的博弈均衡分析
若联盟运营方企业采取“合作”或“不合作”策略的收益分别是
、
,由表可得:
(1)
(2)
得到联盟运营方企业的平均收益是
(3)
得到联盟运营方企业的复制动态方程为
(4)
![](Images/Table_Tmp.jpg)
Table 3. Game payoff matrix under non dynamic mechanism
表3. 无动力机制时的博弈收益矩阵
(2) 入驻企业的均衡博弈分析
假设入驻企业采取“合作”策略的收益
,采取“不合作”的收益是
,由表可得:
(5)
(6)
得出入驻企业采取“合作”和“不合作”策略的平均收益
(7)
(8)
4.2. 均衡点的稳定性分析
令运营企业和入驻企业的复制动态方程
,
可得
,
,系统的5个均衡点分别是
、
、
、
、
,将其带入,
得到雅可比矩阵J'及各项的具体算式如下所示。
其中,
、
、
、
均衡点
对应的雅可比矩阵J1如下:
(9)
以此求得矩阵J1的特征值
、
按照上述方法分别求得A、B、C、D均衡点所对应的特征值如表4所示。
![](Images/Table_Tmp.jpg)
Table 4. Eigenvalues of Jacobian matrix without dynamic mechanism
表4. 无动力机制时雅克比矩阵的特征值
为了保证均衡点的存在,均衡点
需要满足
、
基于
Lyapunov间接法,只有当均衡点的雅可比矩阵所有特征值均为负时,该均衡点是系统的演化稳定策略(ESS) [23] 。无动力机制时均衡点局部稳定性结果如表5。
![](Images/Table_Tmp.jpg)
Table 5. Local stability of equilibrium points without dynamic mechanisms
表5. 无动力机制时均衡点的局部稳定性
4.3. 参数的变化对演化过程的影响
运营方企业与入驻企业动态博弈的演化路径如图1所示。
、
、
、
和
为博弈的均衡点,其中A,D为演化的稳定状态,B、C为不稳定点,O为鞍点,
,
。
据图1可知,经过长期的演化,推荐算法联盟运营方企业和入驻企业均会选择“合作”策略或双方都选择“不合作”策略。若双方均选择“合作”策略,则系统应当收敛于D (1, 1)点,即扩大四边形BOCD的面积。因此,对博弈中双方策略选择影响因素的分析,可以用对BOCD四边形面积的影响因素的分析来代替,但为了方便计算,以下分析四边形ABOC的面积。四边形ABOC面积公式为:
![](//html.hanspub.org/file/73-2310306x101_hanspub.png?20240318083454320)
Figure 1. Evolution path and phase diagram without dynamic mechanism
图1. 无动力机制时的演化路径图及相位图
(1) 运营方企业及入驻企业合作所付出的总成本C的变化对双方策略选择的影响
S是运营方企业及入驻企业合作所付出的总成本C的单调递增函数,总成本C越大,S的面积也会越大,运营方企业及入驻企业选择“不合作”的概率增大。所以,推荐算法联盟运营方企业与入驻企业双方在价值共创过程中的总成本C越小,选择“合作”策略的概率越大,实现合作的概率越大。
(2) 额外价值共创收益R的变化对双方策略选择的影响
因为S关于R的偏导小于0,故S的面积随着价值共创额外收益R的增加而减小,即如果联盟中的双方参与者能够得到的价值共创收益R越大,S的面积就会越小,联盟运营方企业和入驻企业采取“合作”的可能性也随之增大。
(3) 额外收益分配比例β的变化对双方策略选择的影响
令
,可得
。
由式子可知,S有极小值,即存在满足上式的额外收益分配比例β值,使得联盟运营方企业与入驻企业均最有可能采取“合作”策略。
(4) 成本分担比例α对双方策略选择的影响
由上式可知,S是增函数或者减函数取决于β的值。当β < 0.5时,S为单调递增函数,a越大,S越大,双方大概率向“不合作”方向演化;当β > 0.5时,S关于a单调递减,S的随着a的增大而减小,即联盟运营方和入驻企业选择“合作”策略的可能性越大;β = 0.5时,有最优的数值,使得双方向“合作”方向演化的速度最快。
(5) 运营方企业和入驻企业各自的资源与能力水平K1、K2的变化对双方策略的影响
,
S是运营方企业和入驻企业各自努力水平K1、K2的单调递增函数,推荐算法联盟运营方企业与入驻企业自身的能力与资源水平越高,S的面积就会越大,推荐算法联盟运营方企业和入驻企业采取“合作”的概率逐渐减小。
(6) 运营方企业和入驻企业参与成本系数α1、α2的变化对双方策略选择的影响
,
由上式可得,S是运营方企业和入驻企业参与成本系数α1、α2的单调递增函数,在其他条件不变的情况下,随着运营方企业和入驻企业参与成本系数的增大,S的面积就会越大,向D (1, 1)方向演化的概率减小,双方会更加倾向于采取“不合作”的策略。
5. 考虑动力机制时的演化博弈模型
在没有政府干预和内在惩罚时,讨论了运营方企业和入驻企业合作的总成本、成本分担比例、额外收益、额外收益比例、运营方企业和入驻企业各自的资源与能力水平以及双方参与成本系数的变化对合作过程中对价值共创的影响,明确了各参数的作用。但为防止“市场失灵”,联盟内部不仅要建立契约机制,也需要政府的“有形之手”加以干预,承担规范和保障作用。
5.1. 模型演化稳定策略
上述的研究表明推荐算法联盟运营方企业和入驻企业均有两种策略选择,为探究推荐算法联盟是否可以依靠自身长久运营,引入契约机制和政府监管的动力来作为驱动联盟运营的动力机制,来对比运营方企业与入驻企业合作的策略选择,博弈收益矩阵如表6。
![](Images/Table_Tmp.jpg)
Table 6. Game payoff matrix considering dynamic mechanisms
表6. 考虑动力机制时的博弈收益矩阵
(1) 运营方企业博弈均衡分析
若运营方企业采取“合作”策略时,能够获得的收益为
,采取“不合作”策略时的收益是
,由表可得:
(11)
(12)
得到运营方企业的平均收益
为:
(13)
进一步计算得出运营方企业的复制动态方程为:
(14)
(2) 入驻企业博弈均衡分析
如果入驻企业采取“合作”策略能够得到的收益为
,采取“不合作”策略所能够的收益为
,由表可得:
(15)
(16)
得到入驻企业采取“合作”和“不合作”策略的平均收益为:
(17)
通过进一步的计算,得到入驻企业的复制动态方程为:
(18)
5.2. 均衡点的稳定性分析
与不考虑动力措施时的分析类似,令
,
可得
,
可得系统的5个均衡点分别是
、
、
、
、
、雅可比矩阵J'及各项具体算式如下。
其中,
、
、
、
将(0, 0)带入其中,得到均衡点A的矩阵
为
,均衡点A对应
的特征值分别是
、
,以此类推,将各个均衡点的值带入其中,得到矩阵J'的特征值如表7:
![](Images/Table_Tmp.jpg)
Table 7. Eigenvalues of Jacobian matrix under dynamic mechanism
表7. 有动力机制时雅克比矩阵特征值
为了保证均衡点
存在,需要满足
,
,即
、
由于
、
均大于零,故按照
,
均衡点的稳定情况如表8:
![](Images/Table_Tmp.jpg)
Table 8. Local stability of the equilibrium point when considering the dynamic mechanism
表8. 考虑动力机制时均衡点的局部稳定性
据有无动力机制的演化对比图显示,在加入动力机制后,对比均衡点O的位置,O'位置组成的四边形BO'CD的面积更大,也就是在有动力机制时,系统的演化更易达到双方均参与合作的理想状态,有无动力机制时的演化相位对比如图2。
6. 仿真分析
为了更加深入的探究各个因素对于联盟运营方和入驻企业策略选择的影响,直观的探究各种参数变动如何影响双方的策略决策,采用MATLAB软件进行仿真分析,具体参数赋值如表9。
6.1. 价值共创的参与比例对演化结果的影响
在保证各参数不变的前提下,假设运营方企业及入驻企业参与价值共创的比例不同,即令x,y分别取值为(0.2,0.8)、(0.4,0.6)、(0.6,0.4)、(0.8,0.2);由图3可以看出,运营方企业参与合作的比例x或入驻企业参与合作的比例y任一方恒定时,收敛到均衡状态的速度快慢取决于另一方选择合作的比例大小,比例越大,收敛到(合作,合作)稳定状态的速度越快。
![](//html.hanspub.org/file/73-2310306x173_hanspub.png?20240318083454320)
Figure 2. Comparison of evolutionary phase maps
图2. 演化相位图对比
当运营方企业及入驻企业参与合作的初始比例相同时,即x,y的取值分别(0.2, 0.2)、(0.4, 0.4)、(0.6, 0.6)、(0.8, 0.8)时,由图4可以看出,当运营方企业与企业选择合作的初始比例均为0.2时,随着时间的推移,运营方企业与企业均会选择“不合作”策略;当运营方企业与企业选择合作的初始比例增大时,二者选择合作的初始比例越大,收敛到(合作、合作)均衡状态的速度越快。对比图3与图4,可以看出,只要运营方企业和入驻企业一方付出较多的努力参与合作,另一方也会倾向于选择努力策略。
![](//html.hanspub.org/file/73-2310306x180_hanspub.png?20240318083454320)
Figure 3. The impact of the same initial participation ratio in value co creation on the evolution results
图3. 价值共创初始参与比例相同对演化结果的影响
![](//html.hanspub.org/file/73-2310306x181_hanspub.png?20240318083454320)
Figure 4. The impact of different initial participation ratios in value co creation on evolutionary outcomes
图4. 价值共创初始参与比例不同对演化结果的影响
6.2. 参与成本系数与额外收益分配系数关系对演化结果的影响
当运营方企业与入驻企业参与成本系数等于额外收益分配系数,且运营方企业参与成本略高时,取运营方企业的参与成本系数a = 0.6,入驻企业的参与成本系数a = 0.4,数值实验的结果如图5所示;当参与成本系数不等于额外收益分配系数,且入驻企业参与成本略高时,取运营方企业的参与成本系数 a = 0.3,入驻企业的参与成本系数a = 0.7,数值实验的结果如图6所示。
由图5和图6的对比可知,当运营方企业和入驻企业选择合作策略的比例均为0.2,成本参与系数为0.6时,随着时间的推移,运营方企业与企业均会选择“不合作策略”;当成本参与系数为0.3时,运营方企业的演化轨迹先上升后下降,但受入驻企业选择“不合作”策略的影响,最终也会收敛于(不合作,不合作)。在运营方企业与入驻企业参与水平较高时,任意一方承担的成本较小时,向“合作”策略演化的速度均会加快。
![](//html.hanspub.org/file/73-2310306x182_hanspub.png?20240318083454320)
Figure 5. Strategies for both parties with equal participation cost coefficient and additional benefit distribution coefficient
图5. 参与成本系数与额外收益分配系数相等双方策略
![](//html.hanspub.org/file/73-2310306x183_hanspub.png?20240318083454320)
Figure 6. Unequal participation cost coefficient and extra benefit allocation coefficient strategies for both parties
图6. 参与成本系数与额外收益分配系数不等双方策略
6.3. 政府给运营方企业的奖励E和惩罚F以及双方违约成本f的变化对演化结果的影响
首先,在保证其他参数不变的前提下,令运营方企业和企业参与价值共创的初始比例为0.2,模拟政府对企业的奖励和惩罚的取值分别为(0.5, 0.5)、(0.5, 1)、(1, 0.5),从图7可以看出,当政府给运营方企业的奖励和惩罚相等时,最终的稳定策略为不合作;当奖励和惩罚不等时,运营方企业和企业的最终策略选择为“合作”。
![](//html.hanspub.org/file/73-2310306x184_hanspub.png?20240318083454320)
Figure 7. The impact of different E and F on the evolution results
图7. 不同E和F对演化结果的影响
当保证其他参数不变,双方违约成本f取值分别为0.5、0.8以及1时,由图8可以看出,在双方初始参与比例较低的情况下,f值比较小时,对双方“合作”策略的选择没有约束力,随着时间的推移,双方均会选择“不合作策略”,但随着违约成本的增加,双方选择“合作”策略的速度加快。
![](//html.hanspub.org/file/73-2310306x185_hanspub.png?20240318083454320)
Figure 8. The impact of different f on the evolution results
图8. 不同f的对演化结果的影响
7. 结论与建议
为实现多主体协同治理,基于价值共创的视角,拟构建了社交媒体定向广告推荐算法联盟,并基于博弈方的有限理性,建立了运营方企业与入驻企业的合作博弈模型,得出如下结论:
(1) 基于联盟内部动力,在没有动力机制的情况下,分析了运营方企业和入驻企业参与价值共创的成本、价值共创的共同收益等参数的变化对演化稳定策略的影响,研究表明运营方企业与入驻企业合作的基础均是基于投入最小的成本而获得最大的利益,双方成本平均分配的情况下,存在最优的合作收益分配比例,使对方参与到价值共创中,且在价值共创双方均参与概率较低的情况下对演化结果起着决定性作用,但无论是运营方企业还是入驻企业,自身能力与资源水平越高,参与到价值共创中的比例越低,因此政府的组织与干预对于保障联盟的运行至关重要。
(2) 在考虑政府的参与时,无论是奖励还是惩罚,对运营方企业选择合作策略均有一定的约束作用,但加大惩罚力度比加大奖励力度对运营方企业的约束作用更明显。并且如果双方在合作中存在投机行为时,遭到的惩罚越严重,对其投机行为的约束作用越强,也就是惩罚力度越大,也有利于双方进行互利互惠的价值共创。
根据以上结论,提出如下建议:
(1) 如果运营方企业与入驻企业双方各自的资源与能力水平相对较高的情况下,价值共创不易实现,因此可以分级别、分梯度建立多个推荐算法联盟,来对不同规模的使用推荐算法的企业进行规制,也可以尝试发挥用户的作用,建立用户举报侵权行为的相应机制,促进算法的规范治理。
(2) 政府部门需要厘清监管责任,完善处罚和奖励机制。因掌握推荐算法技术能够获取巨大的商业利益,但在联盟运营方企业与入驻企业各自的资源与能力水平较高的情况下,没有动力机制的保障,推荐算法联盟不易建立,因此需要政府的协调干预。但政府应采取包容审慎的监管机制,联合行业专家制定有效机制,奖励与惩罚更加合理化。同时防止干预过度,确保推荐算法联盟的独立性且不被异化。
(3) “利润至上”让社交媒体平台忽视甚至放任广告中推荐算法存在问题,侵犯了用户群体的权益,注重短期利益会对整个行业的利益带来不可估量的负面影响。平台企业应遵守基本的法律原则,积极接受行业的监督,定期进行自我审查,落实自律措施,以确保监管方法的有效性和社会媒体平台行业的健康发展。
参考文献