1. 引言
近年来,随着全面小康社会建设的全面建成,蔬菜定价问题也成为民生的热点问题,为了确保农民劳有所获,同时满足消费者需求,蔬菜定价策略被提出并得到了逐步优化。文献 [1] 通过一系列线性规划问题确定了最优定价策略,文献 [2] 在此基础上引入模糊变量设置模糊参数的函数进行了模糊仿真,并将其嵌入到遗传算法进而得到一个新的蔬菜定价策略。但是线性规划方法并未考虑不同蔬菜间的关系,因此,文献 [3] 利用多元线性回归模型,结合成本加成定价策略为解决多变量蔬菜定价问题提供了新的思路,然而,此类方法对于未来的蔬菜定价相关数据却是难以预测的,故文献 [4] 引入长短期记忆网络(LSTM, Long Short-Term Memory)时间序列方法、文献 [5] 结合温特斯乘数法和ARIMA(p,d,q)模型预测未来蔬菜的最优定价策略。基于文献 [4] [5] 中的时间序列模型,文献 [6] 引入粒子群优化算法实现了蔬菜销售收益最大化模型,文献 [7] 结合斯皮尔曼系数使用了平均趋势拒绝法对蔬菜销售量进行统计分析,以此建立单目标优化模型,力求得到更优的蔬菜定价策略。
上述方法从数据处理、优化、预测等方面较为系统完备地给出了蔬菜销售的最优定价策略,然而,复杂多变的外部环境存在着很多未知的影响因素,随机事件就是其中一个较为重要的影响因素,例如蔬菜定价问题中涉及到的天气、交通等因素都可以定义为随机因素。事件触发是指在特定条件满足时,触发某种行为或响应的过程,以便在事件发生时执行相应的逻辑,可以提高程序的响应速度和效率,使程序在需要时快速做出反应,并提高系统的随机稳定性。为了更好地应对随机事件的发生,文献 [8] [9] 引入了基于事件触发策略的蔬菜数据传输机制,对蔬菜价格进行网络化系统状态估计以获得对蔬菜定价和合理供货的优化模型,但是外部环境仍存在动态性,影响处理蔬菜信息的因素会随着时间变化而发生动态变化,因此文献 [8] [9] 所提出的一般事件触发策略在处理蔬菜信息时存在一定的漏洞,无法保障优化结果的实时性与准确性,基于此,文献 [10] 引入了动态事件触发机制对所研究的系统进行了优化,进而有效地减少了随机事件带来的对信息处理结果准确性的影响。
本文拟研究在有随机因素影响(比如:天气情况、客户粘性、交通拥堵情况等)下的蔬菜定价和补货策略,通过对上述文献中出现的分析方法的整合,采用了异常值处理、数据降维等方式进行数据清洗,通过相关性检验以及具体的皮尔逊相关系数得到不同类别蔬菜间相关性,利用多项式拟合和时间序列模型结合平稳性检验进行各品类的定价策略实施,针对具体品类进行综合评测,采用Z-score标准化和熵权法进行各产品间的定价策略实施。在这些已有方法的共同融合下,本文结合动态事件触发控制策略处理随机因素造成的影响,进而制定了较为合理的蔬菜定价以及补货策略,本文所提方法的优点有:
1) 综合各类方法,从不同方面思考问题,有利于提高蔬菜定价的合理性和科学性;
2) 动态事件触发的引入可以根据实时市场需求和供应情况进行实时定价调整,从而更准确地反映当下的市场条件,在蔬菜供应过剩或供应短缺时做出反应,减少浪费并提高利润;
3) 对生产者而言,可以更好地应对气候变化、自然灾害或其他不可预见的事件。
第一部分:引言,介绍研究背景、目的和意义,以及本文的主要内容和组织结构;第二部分:问题描述,对研究问题进行的详细阐述,旨在为读者提供有关问题的相关信息;预备知识,在学习某门课程或解决某个问题之前,需要预先具备或掌握的一些基础知识;第三部分:数据预处理,改善数据的质量,提高数据分析与挖掘的有效性和准确性;第四部分:模型的假设,对本文的外部因素进行合理假设;模型的建立与求解,通过数学模型,分析相关的蔬菜价格与销售数据,得到最优解决方案;第五部分:结论,得出相关蔬菜定价策略。
2. 问题描述及预备知识
2.1. 问题描述
在生鲜商超中,一般蔬菜类商品的保鲜期都比较短,品相随销售时间的增加而变差,大部分品种如当日未售出,隔日就无法再售,并且,蔬菜类商品不同品类或不同单品之间可能存在一定的关联关系,本文的目的是如何在考虑天气、交通、运输等随机因素的同时,① 研究蔬菜各品类及单品销售量的分布规律及单品间相互关系;② 分析各蔬菜品类的销售总量与成本加成定价的关系;③ 为了更好地制定蔬菜商品的补货和定价决策,商超还需要采集哪些相关数据帮助解决蔬菜定价和补货问题。
注1:本文用到的所有相关数据均来自于2023年全国大学生数学建模竞赛C题。
假设1:假设存在未经销售的单品,商超未进购此单品;
假设2:假设题设外的因素不会作为随机因素被考虑且不会对蔬菜的销量造成影响;
假设3:假设不可抗力因素不会影响商超销售情况。
注2:(1) 以品类为单位做补货;(2) 蔬菜类商品的销售空间有限,可售单品总数控制在27~33个,且各单品订购量满足最小陈列量2.5千克。
2.2. 预备知识
2.2.1. 事件触发
事件触发指的是某个特定事件的发生或引发。事件触发通常用于描述一个动作(或事件)导致系统或程序中的其他动作或程序执行特定的处理。例如,当用户点击一个按钮时,触发一个点击事件,该事件可能会激活与按钮相关的特定功能或动作。事件触发也常用于描述硬件设备或传感器上发生的事件,比如温度传感器检测到温度超过某个阈值时触发一个事件,系统可以执行相应的处理。
2.2.2. 随机事件
随机事件是指在一定条件下发生的事件,其结果是由随机过程决定的,无法被准确预测。这些事件通常受到概率的影响,而非确定性因素导致了它们的结果。随机事件可以在许多领域中出现,如统计学、概率论、物理学和金融学等。在本文中,出现的天气、人流密度、供货量、客户粘性、运输损坏等随机条件。
2.2.3. 相关符号说明
3. 数据预处理
3.1. 删除退货交易和无购买记录的单品
本文将单品成功交易的事件设为“1”,退货的事件设置为“0”,蔬菜定价系统仅采用以“1”为事件触发的条件进一步筛除事件条件为“0”的事件。
3.2. 重新定义时间区段
根据以往蔬菜销售规律为先验条件,蔬菜的销量会出现明显的淡、旺季之分 [11] 。本文依据蔬菜销售数据,统计并制作不同品类的各月份销售量的柱状图。由图1可得,蔬菜供应和需求存在着明显的季节性变化,同时影响着蔬菜销量的走向。蔬菜销量在4月到9月为销售旺季,而10月到次年3月则为销售淡季。
本文将基于蔬菜的销售淡、旺季来对蔬菜的进货量和售价进行分析和预测。不同于以往按照交易所在年份进行分类,此题将重新划分销售旺季、销售淡季,分别对应的是2020.7.1到2020.9.30、2021.4.1到2021.6.30;2020.10.1到2021.3.31为第一阶段;2021.7.1到2021.9.30、2022.4.1到2022.6.30;2021.10.1到2022.3.31为第二阶段;2022.7.1到2022.9.30、2023.4.1到2023.6.30;2022.10.1到2023.3.31为第三阶段。
3.3. 计算各单品不同阶段的销售量
对不同种类的单品进行统计:花叶类的单品数目为5种;食用菌为72种;水生根茎类为19种;辣椒类为45种;茄类为10种;花菜类为6种。
第一阶段第i种单品供给旺季的销售量总和
、淡季的销售量总和为
:
(1)
![](//html.hanspub.org/file/59-2623866x23_hanspub.png?20240506094319847)
Figure 1. Monthly average sales of different vegetable categories
图1. 不同蔬菜品类月平均销售
其中
为第一阶段供给旺季第i个单品的第j次销量;
为第一阶段供给淡季第i个单品的第j次销量。以此类推,第k阶段第i种单品供给旺季、淡季的销售量总和为:
(2)
通过对各阶段各品类销量淡、旺季销量的统计,分析蔬菜品类以及单品的销量分布规律,如图2、图3。
由图2、图3,可以得到销售旺季和淡季的各个品类的销量趋势基本一致;花叶、食用菌、水生根茎、花菜类的销量均表现为第一阶段和第三阶段相差不大,且都要高于第二阶段的销量:其中花叶类和食用菌类销量差距接近一倍,而茄类的销量较为稳定。
![](//html.hanspub.org/file/59-2623866x28_hanspub.png?20240506094319847)
Figure 2. Sales bar chart of different categories of vegetables at different stages of peak season
图2. 销售旺季不同阶段不同品类蔬菜的销量柱状图
![](//html.hanspub.org/file/59-2623866x29_hanspub.png?20240506094319847)
Figure 3. Sales bar chart of different categories of vegetables at different stages of low season
4. 问题1——探寻蔬菜销售的基本规律
针对问题一,现考虑各蔬菜单品各阶段、淡旺季的销售情况,得出不同蔬菜单品销售量分布情况,以此量化各蔬菜单品间的关系和相关性强弱。
4.1. 蔬菜单品的销售量分布规律
为了分析蔬菜单品的销量分布规律,分别找出第一、二、三阶段旺季、淡季最具有代表性的单品,即销量最高的单品,本文通过相关数据制作销量与时间的折线图展示不同阶段淡、旺季各蔬菜单品的具体销量,并以此分析销量分布规律,如图4~图6:
![](//html.hanspub.org/file/59-2623866x30_hanspub.png?20240506094319847)
Figure 4. Sales line chart of the best selling single product in the peak and off-season of the first stage
图4. 第一阶段旺季、淡季销量最佳单品的销量折线
![](//html.hanspub.org/file/59-2623866x31_hanspub.png?20240506094319847)
Figure 5. Sales line chart of the best selling single product in the peak and off-season of the second stage
图5. 第二阶段旺季、淡季销量最佳单品的销量折线图
![](//html.hanspub.org/file/59-2623866x32_hanspub.png?20240506094319847)
Figure 6. Sales line chart of the best selling single product in the peak and off-season of the third stage
由图4~图6可以得到:西兰花和西峡香菇(1)的销量上下波动,销量变化较小;泡泡椒(精品)在经过第一阶段的销售后,诸如芜湖青椒(1)的产品逐渐替代泡泡椒,满足人们对该类食材的需求。
4.2. 蔬菜品类及单品的相关性
考虑不同蔬菜品类间存在差异,在整个系统层面,以相同品类作为事件触发条件,设置为“1”,对相同品类的蔬菜进行统一比较;从品类出发,系统从整个蔬菜系统转为蔬菜品类系统,以相同单品作为事件触发的条件,设置为“1”,对相同的单品进行统一比较。为了得到蔬菜品类以及蔬菜单品之间的相关性,并且,皮尔逊相关系数广泛应用于相关性检验,因此,本文使用皮尔逊相关系数,用于检验两个变量之间的相关性及相关性强弱。
![](//html.hanspub.org/file/59-2623866x33_hanspub.png?20240506094319847)
Figure 7. Calculation process of Pearson correlation coefficient
如图7,n为样本数,先计算两变量的平均值
:
(6)
可得两变量之间的皮尔逊相关系数:
(7)
两种品类三个阶段销售淡、旺季的销量六个数据作为变量进行相关性分析,得到具体的皮尔逊相关系数:
![](Images/Table_Tmp.jpg)
Table 1. Pearson correlation coefficients between different categories
由表1可得到:辣椒类与花菜、花叶、食用菌和水生根茎类的销量存在较强的正相关关系;花菜与花叶的销量的相关性为显著正相关;其他品类间的相关性关系较弱。
246个单品的三个阶段销售淡、旺季的销量六个数据作为变量进行相关性分析,得到单品间的相关系数,单品间的皮尔逊相关系数所生成的相关性热力图,如图8。
由图7,根据各单品间的皮尔逊相关系数可得:四川红香椿分别与小白菜、紫茄子(2)、双孢菇均具有较强的负相关关系,金针菇(袋)(1)与银耳(朵)、圆茄子(1)和净藕(3)均具有较强的负相关关系;银耳(朵)与云南生菜(份)、圆茄子(1)、净藕(3)均具有较强的正相关关系,云南生菜(份)与圆茄子(1)、净藕(3)存在较强的正相关关系,紫茄子(2)与小白菜和双孢菇均具有较强的正相关关系。
![](//html.hanspub.org/file/59-2623866x38_hanspub.png?20240506094319847)
Figure 8. Correlation heat map of typical vegetable single products
5. 问题2——预测各蔬菜单品未来补货量和定价策略
针对这一问题,考虑要求可售单品总数需要控制在27~33个,属于决策类问题,故本文使用熵权法对各蔬菜单品进行评分得出“优质”单品,再结合问题二的思路进行进一步研究各蔬菜单品最佳补货量和定价。
5.1. 经济实力指标归一化处理
研究各蔬菜单品销售量和销售单价发现,2023年6月24日到30日的可售单品为49种,基于可售单品的销量不少于2.5千克,删除7种此阶段内可售单品。
为了保证所陈列的单品能为商超产生利润最大,本文选取销量和利润两个指标进行评价单品是否“优质”。由于所筛选出的指标,具有不同的量纲及其单位,这样的数据会大幅度影响数据分析的结果;为了消除量纲之间的影响,进行数据标准化处理后,以此解决数据可比性,对数据进行标准化处理:
(8)
5.2. 熵权法确定指标权值
为确定所选出的单品指标的重要性,对其计算各准则的熵值和权值来评估其重要性。
1、计算正向指标第i项指标下第j项指标的比重
:
(9)
2、计算各指标信息的熵值,其中第i项指标的熵值为
:
(10)
3、计算各指标权重,其中第i项指标的权重为
,
(11)
以此,得出销量和利润的权值,如表2所示:
![](Images/Table_Tmp.jpg)
Table 2. Weights corresponding to sales and profit
表2. 销量和利润所对应的权值
5.3. 得到“优质”单品蔬菜
为得到“优质”单品,基于效益型的指标:销量和利润,对单品蔬菜进行打分:
(12)
其中,
为第i个单品的得分,
为标准化后的第i个单品的销量,
为标准化后的第i个单品的利润率。以此得到评分最高的33种蔬菜可售单品。
5.4. 制定单品补货量
本文在时间序列稳定的基础上应用AR模型进行求解,分析预测得到2023年7月1日的33中单品的销量,单品预测销量如表3所示:
![](Images/Table_Tmp.jpg)
Table 3. Predicted sales of some individual products as of July 1, 2023
表3. 2023年7月1日部分单品的预测销量
本文得到33种选择出的单品2023年7月1日的销量后,根据得到的7月1日日销量:其中,3种单品马齿苋、娃娃菜、面条菜在7月1日的日销量为0,为了保证商超利润,删除这三种单品;青线椒(份)在当天的销量为负数,去除此单品;在2020至2022年7月1日期间,商超未销售本地小毛白菜,表明该单品的需求较低,剔除此单品数据。
5.5. 制定各单品的定价策略
1、定义决策变量:定义决策变量为第i个单品的定价,
2、建立目标函数:本题需要在满足市场对各品类蔬菜商品的前提下,保证商超收益最大。由此,制定多目标规划:
(13)
其中,
为已知的单品订购量。由于要保证需求侧尽量被满足,需要使得预测销量,进货量尽量被卖出,即进货量与实际销量的差尽可能小,如式(23)。
(14)
其中,
为第i个品类第j个单品的损耗率,同时要保证实际收益最大,即收益与实际收益率的乘积最大。
3、构建约束条件:各单品的定价应该趋于上四分位数与下四分位数之间:
(15)
其中,
为第i个单品的下四分位数,
为第i个单品的上四分位点。
根据目标函数和约束条件,构建多目标线性规划:
(16)
利用matlab的function函数求解,得到具体的单品定价策略,单品定价,如表4:
![](Images/Table_Tmp.jpg)
Table 4. Pricing strategies for some individual products
表4. 部分单品的定价策略
6. 寻找其他增加制定补货和定价策略的有效性的相关因素
6.1. 结合控制策略确定蔬菜定价
6.1.1. 多目标规划
现以天气作为控制蔬菜定价的因素为例,每日的天气存在随机性,人们选择购买蔬菜的意愿也会随着天气变化而发生变化,例如,在天气晴朗的时候,人们大概率会选择出门购买;而在下雨的时候,人们购买蔬菜的意愿普遍较低。人们的购买欲望影响着蔬菜的购买量,从而影响蔬菜价格。
由于天气作为宏观影响因素,不同的天气的影响可以直接展现与最终蔬菜定价的结果,现将天气情况分为四类:晴朗和多云天气,阴天,雨雪,以及大风的极端天气每种天气情况有对应不同的蔬菜影响情况,不同的天气发生情况呈现随机性,故设晴朗和多云为
,阴天为
,雨雪为
,各种极端天气为
(17)
且满足:
(18)
以晴朗天气的人流量定义为
,多云、阴天、雨雪的人流量分别为
。
针对第四问引入商超的第i种单品的订货量
、当日未销售完蔬菜每千克处理费用H、第i种单品每千克的运输费用
。
1、定义决策变量:定义决策变量
,第i个单品的定价。
2、建立目标函数:本题需要在满足市场对各单品蔬菜商品的前提下,保证商超收益最大。由此,制定多目标规划:
其中,
为第i个品类第j个单品的损耗率,同时要保证实际收益最大,即收益与实际收益率的乘积最大:
(19)
还需要使商超的成本最小,即处理费用和运输费用要最小:
且
(20)
3、构建约束条件:各类蔬菜均需订货,即订货量不小于0:
(21)
各单品的定价应该趋于上四分位数与下四分位数之间:
(22)
其中,
为第i个单品的下四分位数,
为第i个单品的上四分位点。
根据目标函数和约束条件,构建多目标线性规划:
(23)
综合考量收益率最高,处理费用和运输费用较低,通过设置和解得多目标线性规划,得出具体的补货策略。
6.1.2. 灰度关联性分析
对于天气等随机因素对于整个动态随机系统的影响,本文使用灰度关联性分析将其影响大小以关联度进行量化,以下是相关算法流程:
(1) 确定参考数据列
参考数据列应该是一个理想的比较标准,可以以各指标的最优值(或最劣值)构成参考数据列,也可根据评价目的选择其它参照值.记作
(2) 对指标数据进行无量纲化
在进行灰色关联度分析时,一般都要进行无量纲化的数据处理。
使用
和
。
无量纲化后的数据序列形成如下矩阵:
(24)
(3) 逐个计算每个被评价对象指标序列(比较序列)与参考序列对应元素的绝对差值即
(其中,n为被评价对象的个数)
(4) 确定
与
。
(5) 计算关联系数
分别计算每个比较序列与参考序列对应元素的关联系数
(25)
(6) 计算关联序
对各评价对象(比较序列)分别计算其个指标与参考序列对应元素的关联系数的均值,以反映各评价对象与参考序列的关联关系,并称其为关联序,记为
(26)
利用MATLAB软件求解,得到三个指标与蔬菜品类季度平均销售量的标准化数据和关联度,并以花叶类蔬菜为代表展示,如图9。
经过将原指标值标准化的处理,可以观察到各蔬菜品类的定价与相应蔬菜单品的批发价格、天气、利润率呈现出令人满意的拟合效果。
三个指标与6大蔬菜品类月平均定价的关联度如表5。
6.2. 其他因素影响
1、季节性:不同季节和不同天气不仅会影响人们对不同蔬菜的倾向,也会影响蔬菜的供应。商超得到不同季节、不同天气对蔬菜供应的影响和人们对蔬菜的倾向的影响的数据,根据所得到的关系会更精确地匹配供需关系。
图9. 三个指标与蔬菜品类季度平均销售量的标准化数据和关联度折线图
![](Images/Table_Tmp.jpg)
Table 5. Correlation between three indicators and seasonal and monthly average pricing of six major vegetable categories
表5. 三个指标与6大蔬菜品类季月平均定价的关联度表
2、节假日:不同节假日,人们对蔬菜的需求程度不同,如:周末、端午、春节等节假日,人们会更多地购买蔬菜来准备餐食;而国庆节,劳动节等节日,人们往往会有出行计划,从而减少蔬菜购买。因此,得到节假日对蔬菜销量的影响,从而制定相应的订货、补货计划。
3、客户粘性:商超可以充分调查民意,搜集蔬菜定价、合理的蔬菜搭配以及是否提供配送服务,对客户忠诚度影响的数据。以此,商超制定惠民的定价,搭配合理的蔬菜进行售卖,同时可以提供相应的配送服务,来提高客户忠诚度,占据更多的市场份额。
4、销售策略:不同的销售策略会极大影响销量,促销或其他打折活动,会使得人们增加购买蔬菜的欲望。调查不同时间段,不同销售策略对销量的影响。以此制定相应销售策略。
5、供应链和运输问题:选择不同的供应链,不同的成本价格,以及与之相对应的运输路线。商超可以调查不同品类,不同单品的定价,以及运输问题所对应的价格。根据数据,综合考虑成本价,运输问题,来制定订货策略降低成本。
7. 结论
该模型根据销量,题设条件对时间进行划分为销售淡、旺季,更准确地分析各品类和单品的分布规律。(1) 该模型依据新划分的时间段,对销售量与成本加成定价的关系拟合出的方程,效果理想,准确率较高,使得后续规划问题所给出的补货量和定价策略较为理想;(2) 该模型的多目标规划问题,不仅考虑到了商超的利润最大化,同时兼顾了尽可能满足顾客需求。(3) 该模型可以根据给出的销量和蔬菜的批发价格,得到订货量和定价策略,模型可操作性强。模型使用规划思想,单目标线性规划和多目标线性规划模型,模型易懂,便于理解。
基金项目
全国大学生创新创业训练项目(No. 202310703079)。
NOTES
*通讯作者。