1. 引言
公路货运行业是国家基础性、战略性的产业,是社会经济发展的重要组成部分,也是保障产业供应链稳定的关键环节 [1] 。随着我国互联网、物联网的快速发展,公路货运行业与互联网技术的融合加快了公路货运行业的数字化、信息化建设进程 [2] 。近年来涌现出大量基于互联网和信息技术的车货匹配平台型企业 [3] 。
个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品 [4] [5] [6] 。车货供需信息的有效匹配推荐不仅可以降低匹配成本,提高双方交易效率,还能够提高用户粘性,是物流平台能够长远发展的核心 [7] [8] [9] [10] 。许多学者针对车货匹配的个性化推荐进行了研究。
傅怡 [11] 提出了一种基于参数自适应调整的改进蚁群算法,提升了物流的运作效率,使物流运力资源得以合理配置。叶子 [12] 建立了一对多成本最小化的车货匹配模型,采用禁忌搜索算法得到了模型的最优解。李蒙 [13] 应用深度学习模型构建了物流服务交易群智推荐算法。张会凤 [14] 以托运意愿和承运意愿最大化作为目标函数构建车货匹配模型,验证了匹配模型的有效性和实用性。高艺 [15] 给出了基于AHP的物流供应商物流能力的评价方法,据此完成了货运信息的个性化推荐。张青杰 [16] 综合运用图论中顶点着色法、量子进化算法等对物流供需信息的组合匹配模型进行了研究。穆文忠 [17] 采用AHP和系统动力学的因果分析法得到了每个评价指标的权重并确定了相应指标的数据来源,实现了对物流配送方案服务质量的数值评估。方超 [18] 通过AHP法优化构建了用户偏好模型,将用户偏好模型与协同过滤算法绑定产生了推荐结果。钱勇 [19] 利用AHP方法建立了层次结构的物流服务提供商指标体系,确定出了最佳的物流服务提供商。
然而,公路货运的车货配载率低、成本一直居高不下等问题,依然是制约公路货运行业发展的重要因素。因此,针对当前物流公共信息平台服务不足的问题,本文以中国物通网数据为研究对象,结合物流服务商的综合评价,构造了车货匹配的个性化推荐模型,以期提升车货配载效率,提高物流公共信息平台的服务质量。
2. 基于内容的推荐系统
基于内容推荐方法的理论依据主要来自于信息检索和信息过滤,所谓基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项目。过程一般包括以下三步:
1) 内容表征:为每个项目抽取出一些特征来表示此项目;
2) 特征学习:利用一个用户过去喜欢的项目的特征数据,来学习出此用户的喜好特征;
3) 生成推荐列表:通过比较用户的喜好特征与候选项目的相似度,为此用户推荐一组相关性最大的项目。
在推荐系统中,关于相似度有多种度量可以应用,而余弦相似度的计算相对简便且准确性较高,因此被广泛使用。
设
是两个n维向量,
,则
与
夹角
的余弦可表示为
0度角的余弦值是1,而其他任何角度的余弦值都不大于1;因此余弦值越接近1,两者之间的夹角越接近0˚,也就是两个向量相似度越高 [17] [18] 。
余弦相似度计算源于向量余弦计算的思想,通过测量两个向量内积空间夹角的余弦值来度量它们之间的相似性。本文将应用余弦相似度计算车源信息与货源信息的匹配程度。
3. 公路货运物流的车货匹配推荐
3.1. 获取数据
本文的研究数据选自中国物通网。中国物通网是专业的一站式物流信息平台,由多位物流及电子商务专家根据国内外企业高速发展的现状,商品流通进入速度快、方位全、地域性广等特征,专业设计、精心制作的物流行业信息门户网站。
以出发地为北京、目的地为广州的货物A为例,为其进行车货匹配,货物A的货源信息如表1所示。
![](Images/Table_Tmp.jpg)
Table 1. Source information of goods A
表1. 货物A的货源信息
首先在物通网车源服务页面收集以北京为出发地、广州为目的地的车源信息。为方便后期综合评判,仅选择车主为物流公司的车源信息;同时为保证数据的有效性,所有的车源信息的车辆参数选择为“6.8米以上”,限载重量选择为“10吨以上”,车源信息如表2所示。
3.2. 信息量化
由于收集到的数据属性的种类繁多复杂,因此首先对数据进行预处理。
数据清理:为了使数据整洁有效,所有的货源与车源信息发布时间取在一周之内,过早或者过晚的信息将不再数据集当中。
数据量化:将需求车型、车辆参数按照一定的范围进行分类,用数字分出等级,进行量化。车辆类型主要以车长分类,分别为2~5米、5~8米、8~12米、12~15米、15~17.5米、17.5米以上,依次用数字1~6表示。
依据以上量化原则对货源信息及收集到的50条车源信息进行量化,结果如表3、表4所示。
3.3. 计算项目之间的相似度
下面以量化后的车源信息(车辆参数、限载重量)与货源信息(需求车型、货物重量)为研究对象,运用余弦相似度计算货源信息与车源信息的相似度,继而筛选出分值最高的N条车源信息作为候选车源,应用到后续发货用户选择货车的过程中。
![](Images/Table_Tmp.jpg)
Table 3. Information data of goods A after quantization
表3. 货物A量化后信息数据
![](Images/Table_Tmp.jpg)
Table 4. Vehicle source information data after quantization
表4. 车源量化后信息数据表
利用表3和表4中的信息计算货物A与系统车源的相似度,结果如表5所示。
![](Images/Table_Tmp.jpg)
Table 5. Similarity between goods A and vehicle source of the system
表5. 货物A与系统车源相似度
对计算得出的所有余弦相似度值取TOP-10作为候选推荐车源,结果为[0.999786, 1.000000, 1.000000, 0.999786, 1.000000, 1.000000, 1.000000, 1.000000, 1.000000, 0.999774],其对应车源分别为车源7,车源9,车源19,车源20,车源22,车源24,车源35,车源37,车源41,车源43。
3.4. 基于AHP方法的物流公司评判
针对初步推荐的10条车源信息,对其所属物流公司其他信息进行收集,包括运输的轻货价格及重货价格、运输时效、企业诚信指数、企业年限 [20] ,具体信息如表6所示。
![](Images/Table_Tmp.jpg)
Table 6. Logistics company information
表6. 物流公司信息
3.4.1. AHP方法确认指标权重
应用AHP方法求解指标权重。对5个指标进行两两比较,得到指标因素判断矩阵如表7所示。
![](Images/Table_Tmp.jpg)
Table 7. Index factor judgment matrix
表7. 指标因素判断矩阵
设
首先将判断矩阵A每行元素相乘,得
对向量M的元素开5次方根得
,
将
标准化得
进一步计算,得最大特征值为
下面进行一致性检验。一致性指标为
;一致性比率为
,其中平均随机一致性指标RI如表8所示。
![](Images/Table_Tmp.jpg)
Table 8. Average random consistency index RI
表8. 平均随机一致性指标RI
一致性比率
,通过了一致性检验。因此,指标的权重向量为
3.4.2. 计算物流公司综合得分
首先根据上述评判指标因素的评判标准建立评分等级,建立四级评判评语集
,分别表示“不好”、“一般”、“较好”、“很好”,并设置评判等级分值分布如表9所示。
以7号物流公司为例,根据表9评判等级为物流公司的各个指标因素进行打分,得到7号物流公司的得分,如表10所示。
根据各指标权重与各指标具体得分结合计算加权平均,对7号物流公司的综合评分进行计算:
7号物流公司的综合得分为63.02479。类似可得其余物流公司的综合分数,结果如表11所示。
![](Images/Table_Tmp.jpg)
Table 11. Each index factor score and comprehensive score of 10 logistics companies
表11. 10家物流公司各个指标因素得分及综合分数
根据综合得分进行排序,得分最高的TOP5作为最终候选车源,依次分别为车源9、车源22、车源20、车源35、车源24。
4. 结论
本文以物通网数据为研究对象,首先应用余弦相似度计算货源信息与车源信息的相似度,筛选出了TOP-10候选车源;其次通过AHP方法确定物流公司的评判指标权重,给出了TOP-10候选车源的综合得分,基于此得到了最佳车源匹配的个性化推荐。此方法既满足了货主对个性化货运信息推荐的需求,同时也提高了车辆资源的利用率,为物流行业信息化水平的发展提供了一定的理论基础。与此同时,由于数据获取艰难以及模型相对简单,推荐的精准度还有待提升。利用协同过滤模型将车源信息和货源信息的匹配时多次模拟以提高准确性是未来需要进一步研究的方向。
资助项目
大学生创新训练计划项目(202110069006)。