1. 引言
软集理论是俄罗斯学者Molodtsov于1999年提出的用于处理模糊性、不确定性问题的数学工具,该理论相较于其它理论弥补了参数化不足的问题,从参数化角度描述对象与集合之间的关系,是对集合中的对象进行“近似”性的刻画,而无需精确的信息就能够反应出对象与集合之间的关系 [1] 。但是软集理论中参数的取值只能为0或1,该种取值不利于处理含有复杂模糊信息的问题,在对象的属性程度上的描述也存在不足。于是Maji等人在2001年将模糊集和软集理论相结合,创新性地提出了模糊软集 [2] 的概念。模糊软集将软集理论与模糊集理论相结合,将软集的参数取值从{0, 1}的二值集合拓展为[0, 1]区间上的数值,从参数化和程度化的角度描述了对象所具有的属性特点。现存的模糊软集的研究主要集中在模糊软集的运算及性质 [3] [4] [5] 、模糊软集与其它不确定性理论的结合 [6] [7] [8] [9] [10] 、模糊软集的决策及参数约简 [11] [12] [13] [14] 上。
三支决策 [15] 是姚一豫等人在决策粗糙集的理论模型基础上提出的决策理论,相较于传统二支决策肯定与否定的决策行为,三支决策增加了对了解不全面、不充分的事物的延迟决策的处理。三支决策的理论思想为将对象整体分为三个部分,且分别对这三个部分采取接受、拒绝和延迟决策的行为。该决策方法为复杂问题提供了简洁高效的解决方法,且一经提出得到了迅速的发展。但是三支决策在软集领域的应用较少,巩增泰等人 [16] 将直觉模糊集诱导为软集,利用三支决策理论提出了软集三支决策的定性模型和定量模型。冯峰等人 [17] 利用软粗糙集理论建立了一种基于犹豫模糊集的广义粗糙模型,借助给定的预决策集,计算软上近似集并确定评价函数,提出了一种基于软粗糙集的犹豫模糊三支决策方法。
现实中我们获取的数据之间通常存在着一定的偏好或有序关系,基于等价关系的经典粗糙集理论难以处理这类偏好或有序信息,为此,Greco定义了一种新的二元关系——优势关系 [18] 。但是由于传统优势关系普遍存在条件过于苛刻、对关系的描述过于粗略等缺点,无法精确地刻画两个对象之间的差异,限制了它们在实际问题的应用,因此吴家明等人提出了优势关系、劣势关系与信息熵的结合——
优劣关系熵 [19] 。以上优势关系的计算中都只考虑优势参数的个数,而未将参数值纳入计算中,导致从程度上刻画对象间的优势关系不够深入,因此本文在
优劣关系熵的基础上纳入参数值的计算,提出优势熵关系。在模糊软集决策应用领域的研究工作中鲜有报道模糊软集三支决策方法的研究,因此本文结合优势熵关系提出模糊占优度,从而对模糊软集进行三支决策。
2. 基础知识
定义1.1 [1] 设U为非空有限论域,E是参数集,
为论域U的幂集,
,称序对
为论域U上的软集,若F是A到
的一个映射,即
,对于
,
,
称为软集
的e-近似集合。
定义1.2 [2] 设U为非空有限论域,E是参数集。
,
是U上所有模糊子集所组成的集合,称序对
是U上的模糊软集,其中
是A到
的一个映射,即
。
对于任意的
,
可以看作是模糊软集
的e-近似集合,且
可以被表示为
其中,表示对象x属于模糊集
的隶属度。
软集是用0和1的精确化描述来对参数进行近似,模糊软集将参数的取值取在区间
内,用区间
间的数来对参数进行模糊近似,用模糊近似代替了软集的精确近似。模糊软集从程度化和参数化的角度来描述客观事物,并通过程度化描述“是”或“不是”的中间状态,更符合人类的思维逻辑 [20] 。
例1.1设
表示房子的集合,A是参数集合且
模糊软集
可以表示为:
,
,
,
,
.
这里模糊软集
所描述的是对于购买者来说“房子的吸引力”。为了方便储存及直观表示,可以将模糊软集
用一个二维表格表示,如表1所示:
Table 1. Fuzzy soft set ( F ˜ , A )
表1. 模糊软集
定义1.3 [21] 设
是论域U的一个模糊软集,
满足条件
,即所有对象在所有参数下的隶属度为0,则称
为模糊零软集;
满足条件
,即所有对象在所有参数下的隶属度为1,则称
为模糊全软集。
定义1.4 [21] 设
和
是论域U的两个模糊软集,若
使得
成立,则称
为
的模糊软子集,记为
;如果满足
且
,则
和
是模糊软相等的,即
。
在实际问题的分析中,我们所获得的数据之间通常存在着一定的偏好或有序关系,这导致对象之间也存在优势或劣势关系。下面是模糊软集上的优势关系的定义。
定义1.5 [22] 设
是论域U上的一个模糊软集,称
为模糊软集的优势关系,即
为对象
在参数
下的参数值。
在任意参数
下的取值均大于等于对象
的值,则
满足该优势关系,表示在该模糊软集中对象
比
更具有优势。
定义1.6 [22] 设
是论域U上的一个模糊软集,
,定义
为对象
和
的优势参数集,称矩阵
为优势矩阵,其中优势矩阵为
维的矩阵且
。
但是由于该定义中优势关系的条件过于苛刻,且存在对关系的描述上过于粗略的缺点,故刻画两个对象间的差异不够精确,限制了这些对象在实际问题中的应用,因此吴家明 [19] 等人提出了优势关系、劣势关系与信息熵的结合——
优劣关系熵。
定义1.7 [19] 设
为一个基于
的优劣关系的信息系统,其中
为对象集,
为非空有限属性集,
是所有属性值的集合,
是属性
的值域,且属性值域
有偏好次序。
是一个信息函数,
,
,
,
为参数且
。则
优势关系定义为:
表示
在
程度上优于
。
相较于传统的优势关系,
优势关系提出了优势程度参数
的概念,能够更加灵活的刻画两个样本之间的优势程度。
定义1.8 [19] 设
为一个基于
的优劣关系的信息系统,对于任意
,u的
优势类定义为:
。
定义1.9 [19] 设
为一个基于
的优劣关系的信息系统,其中
为对象集,则
的优势关系矩阵定义为:
,其中,
,
.
定义1.10 [19] 令
是U上的
优势关系矩阵,则
优势关系熵定义为
其中,
表示矩阵的基数。
优劣关系熵可以从不同粒度的层次上对目标概念的不确定性进行度量 [19] 。但是无论是传统的优势关系还是上述定义的
优势关系,它们都只考虑不同属性值下的大小来确定优势关系,而没有将属性值纳入计算中,因此本文提出了优势熵关系。介绍优势熵关系前,首先引入模糊软矩阵及取优运算的概念。
定义1.11 [14] 设
是论域U的一个模糊软集,定义模糊软矩阵
,其中
,
。具体如下:
.
其中,为模糊软矩阵的第i行,表示对象
在各个参数下的取值向量。
定义1.12设
是论域U的一个模糊软集,M为
的模糊软矩阵,
,定义符号
为两对象的取优运算,对象
与
的取优运算为
记为
,其中
,
.
表示对比对象
与
的各参数下的取值,保留
大于等于
的参数值。得到两对象的取优向量后,可定义两对象的优势熵及模糊软集的优势熵关系。
定义1.13设
是论域U的一个模糊软集,
,对象
与
在参数子集A下的优势熵定义为
.
其中,
表示对向量
的各元素求和,
表示求集合A的基数。
表示对象
在参数集A下优于对象
的熵值,称
为模糊软集的优势熵关系,即:
.
优势熵关系相较于上述定义的传统优势关系和
优势关系,将对象的属性值纳入了计算中,在比较两个对象优势关系的同时,对它们的优势程度也有了一定的刻画。
定义1.14设
是论域U的一个模糊软集,
,定义
为对象
优于
的优势熵值,称矩阵
为优势熵矩阵,其中优势熵矩阵为
维的矩阵。
定义1.15设
是论域U的一个模糊软集,称
为对象
的优势熵类。
性质1.1设
和
是论域U的两个模糊软集,
为
的模糊软子集,
,
和
分别为
和
上的优势熵关系,
,
和
分别为
在优势熵关系
和
下的优势熵类,M为
的模糊软矩阵,有如下性质:
1)
是自反的和传递的;
2)
,有
;
3)
,有
;
4)
当且仅当
;
5)
,有
且
。
定义1.16设
是论域U的一个模糊软集,
为对象
在优势熵关系
下的优势熵类,称
为对象
的模糊占优度,其中
表示集合的基数。
对象的优势熵类表示的是该对象所优于的对象的集合,模糊占优度是指该对象优势熵类的基数与论域的基数的比值,模糊占优度反应了该对象在这个模糊软集中所占优势的程度,模糊占优度越高,所占优势程度越大。
例1.2某人想要购买一部手机,销售员为其挑选了六部手机供其选择,模糊软集
描述了该人对6部手机的购买意愿和看法,6部手机的集合为
,手机参数构成的参数集为
,其中
分别表示“手机价格”,“屏幕尺寸”,“内存容量”,“处理器型号”,“操作系统”。模糊软集
的信息表如表2所示。
Table 2. Fuzzy soft set ( F ˜ , A )
表2. 模糊软集
要求该模糊软集的优势熵矩阵,首先求出每个对象的优势熵值:
,
,
,
,
,
,
.
得出优势熵矩阵为
由优势熵类的定义可求得各对象的优势熵类及模糊占优度为:
,
,
,
,
,
。
,
,
,
,
,
。
3. 基于优势熵矩阵的模糊软集的三支决策方法
3.1. 相对损失函数
传统的二支决策思想为将一个整体划分为两个部分,并对这两个部分分别采取接受和拒绝的行动。三支决策作为二支决策的延伸与发展,近年来受到广泛的关注与研究。三支决策理论是关于思维、问题解决和信息处理的三元理论 [23] 。当面对一个复杂的整体时,通常会将其分解为三个部分,以实现一个高层次、快速、易于理解的概念化。三支决策的决策框架为三分-行为-结果(TAO),它由三个部分组成 [24] :
1) 将目标整体进行三分,将其分为三个部分,
2) 对这三个部分设计处理策略,
3) 将三分法和行动相结合,得到一个理想的结果。
由TAO模型可看出,三支决策的三分是关键,在研究三分的问题上,Yao [25] 提出了一种在集合理论中基于评估的模型,首先给出需要评估的实例,例如学生的成绩、患者的血压、软件的性能等,在根据它们的评估值,通过一对阈值来将对象集合划分为三个分别具有高,中和低值的对象子集。
定义2.1 [26] 设非空集合U为对象的论域。函数
称为求值函数。对于
,
称为x的评估值。给定一对阈值
,可以将U分为正区域、负区域和边界区域,如下所示:
条件
确保这三个区域是两两不相交的。
对集合进行三划分以后,需要对这三个划分后的子集设计相应的处理策略,对这三个区域构建接受、拒绝和既不接受也不拒绝的决策规则,即对于
:
(P) 如果
,即
,则接受x;
(N) 如果
,即
,则拒绝x;
(B) 如果
,即
,则既不接受也不拒绝x。
也就是说当一个对象的评估较高,属于闭区间
时,对该对象采取接受的策略;当一个对象的评估值较低,属于闭区间
时,对该对象采取拒绝的策略;当一个对象的评估值既不高也不低,属于开区间
时,则对该对象采取既不接受也不拒绝的策略,即做出不承诺的决策。本文用模糊占优度来作为对象的评估函数,给出对象的评估值。
定义2.2设
是论域U上的一个模糊软集,给定一对阈值
,可以将U分为正区域、负区域和边界区域,如下所示:
条件
确保这三个区域是两两不相交的。
模糊占优度
表示的是对象在该模糊软集所有对象中的占优程度,若一个对象的占优程度较高,属于闭区间
时,则将该对象划分到正域中;若一个对象的占优程度较低,属于闭区间
时,则将该对象划分到负域中;若一个对象的占优程度既不高也不低,属于闭区间
时,则将该对象划分到边界域中。分别对这三个区域构建不同的决策规则,即对于
:
(P) 如果
,即
,则接受x;
(N) 如果
,即
,则拒绝x;
(B) 如果
,即
,则既不接受也不拒绝x。
由上可知,将对象集合三分的关键是阈值的选取,在决策粗糙集中是通过引入损失函数,以最小化决策风险为目标来对阈值
进行求解。
两种状态集
表示事件属于X或不属于X两种状态,决策集
表示将对象划分到正域、边界域或负域的决策行为,用
、
、
分别表示当
时,采取
决策行为时的损失函数值;用
、
、
来分别表示当
时,采取
决策行为时的损失函数值,则决策损失矩阵如表3所示。
表中,
及
表示做出正确分类带来的损失值,
及
表示做出错误分类所带来的损失值,
及
表示做出延迟决策所带来的损失值,根据最小风险Bayes决策原则,通过计算代价函数 [15] 可得
,
随着对阈值求解研究的更加深入,Liu [27] 将绝对损失函数替换为相对损失函数,将阈值重写为
,
其中,
表示当
时,将对象放入正域和边界域时的损失差异,同理
、
、
。 [28] 将
、
、
减去
,同理
、
、
减去
得到相对损失函数表如表4所示
Table 4. Relative loss function table
表4. 相对损失函数表
其中,
,
,
,
。
3.2. 基于优势熵矩阵的模糊软集三支决策方法
优势熵矩阵的每一行表示该对象优于除自己本身外其他对象的熵值,由于优势熵的计算公式是单调递减的,故熵值越小则表示该对象越优,每一行的最小熵值
表示该对象优于其它对象的最大程度,最大熵值
表示该对象优于其它对象的最小程度,该行的平均熵值
反映了该对象优于其它对象的综合优势程度。Liu和Zhou [29] 在求相对损失函数值时引入了一个参数
来求延迟决策时的损失函数值,本文同样引入参数
来求边界域内对象的损失值。则基于优势熵值的相对损失函数表如表5所示。
Table 5. Relative loss function table
表5. 相对损失函数表
这里的
和
都取零是指正确划分对象所产生的损失值为零,当对象不属于X时,将其划分到正
域中所产生的损失值为
,意味着对象在该模糊软集中越优,
越小,错误分类所产生的损失值
越大;当对象属于X时将其划分到负域的损失值为
,意味着对象的优势熵值越稳定,错误分类所产生的损失值
越小;用
和
表示延迟决策所带来的损失,其中参数
,由此可得阈值分别为:
,
.
为了更符合现实情况和语义,认为每个对象都有六个损失函数,因此每个对象都能求出两个阈值,为了减少由于多个阈值而增加的决策风险,计算它们的平均阈值,通过平均阈值来反映阈值的总体趋势,为决策过程提供便利,计算公式为 [30] :
,
.
续例1.2:计算得该模糊软集得优势熵矩阵为
取
,依据表5来计算每个对象的相对损失函数表,如表6所示:
Table 6. Table of relative loss functions for each object
表6. 各对象相对损失函数表
得到相对损失函数以后,可求得每个对象的阈值及最终阈值,如表7所示:
得到阈值后,根据每个对象的模糊占优度对对象进行三支决策,决策表如表8所示:
由此可得,销售员可向其推荐第5和第6部手机供其选择购买,可将第1、2、4部手机纳入考虑之中,可不考虑第3部手机。
4. 算例分析
通过对葡萄干质量的判定实例来验证本文所提三支决策方法的实用性和有效性。
4.1. 实例验证
有一批种植的不同品种的葡萄所制成的葡萄干样本,数据来源于UCI数据库,选取某一品种的50个样本,将其标记为
,判定该批葡萄干样本的质量所考虑的参数共七个,分别为葡萄干的面积(e1)、长轴长度(e2)、短轴长度(e3)、偏心率(e4)、凸面积(e5)、范围(e6)及周长(e7)。本例中的两种状态分别为品质优和品质差,三种决策分别为将葡萄干样本划分至品质优类、将葡萄干样本划分为品质差类以及品质需进一步考量类。
首先对数据进行处理归一化,再通过本文所提方法算出这50个样本的模糊优势占优度,可得到它们占优度的排名如图1所示。
Figure 1. Fuzzy dominance ranking of 50 samples
图1. 50个样本的模糊占优度排名
由图可知质量最优对象为25和41。通过计算可得到两阈值分别为
,可将该批葡萄干样本依据模糊占优度进行三分得到表9。
由表可知,这50个葡萄干样本共被划分为三个部分,其中有15个样本划分至正域,也即品质优秀类;有17个样本划分至负域,即品质差类;18个样本划分至边界域,即品质需加以考量类。由结果可知该三支决策方法是切实可行的。
4.2. 对比分析
在模糊软集决策方法的研究中,还没有三支决策的研究,现有的决策方法都是对决策对象进行排序,因此用本文的方法求出各对象的排名后与现存方法进行对比分析。模糊软集的决策方法主要可分为四类,分别为基于相对优势参数数量及相对劣势参数数量的决策方法、基于对象参数值形成模糊选择值的决策方法、基于对象与理想解的相似度及与正负理想解的距离的决策方法和基于水平软集生成水平选择值的方法。
Roy等人 [31] 通过对比各对象的优势参数的个数建立对象间的关系对照表,用对照表的行和与列和的差值生成对象的得分值,从而将对象进行排序;孔芝等人 [32] 通过对对象参数值求和得出对象的模糊选择值,从而将对象进行排序;Hwang等人 [33] 提出的Topsis法是通过计算对象与正理想解和负理想解之间的距离得出各对象的综合评分,从而对各个对象进行排名。将本文方法与以上三种方法进行比较,获得排名比较结果,如图2所示。
从图中可以看出,本文所提方法与现存方法的运算结果具有高度的相似性,且相较于传统方法,本文的方法还能将对象进行分类。
Figure 2. Comparison chart of ranking of 50 samples under three methods
图2. 50个样本在三种方法下的排名对比图
冯峰等人 [14] 提出了基于水平软集的模糊软集决策方法,通过设置水平值将模糊软集转化为软集,最后得出软集的水平选择值从而得出最优对象。由于水平软集方法所计算的各对象水平决策值相同值较多,因此用本文方法与该方法进行对象排序比较。在计算葡萄干模糊软集的水平软集时将水平值设为0.9求出各对象的得分值,将其排名与本方法所得排名进行比较,选排名前七的对象得出比较结果如表10:
由排序结果可知,在冯峰等人所提方法中,x25和x41为最优对象;Topsis法和孔芝等人所提方法中,x25为最优对象;Roy等人所提方法中,x31和x1为最优对象;本文所提方法中,x25和x41为最优对象。用不同方法所得对象排名存在略微的不同,但是对象x25和x41均在每种方法的排名前三中。
5. 总结
本文对模糊软集上的三支决策问题进行了研究。首先定义了优势熵关系,并基于此构造优势熵矩阵并定义了优势熵类,基于优势熵类给出了模糊占优度的定义。接着依据优势熵矩阵定义模糊软集的损失函数表,计算模糊软集的三支决策阈值,结合模糊占优度来实现模糊软集的三支决策。最后进行了实例的对比分析,验证了本文呢所提方法的实用性和有效性。