基于BP神经网络的自适应模糊半参数时间序列模型

doi:10.12677/MOS.2024.132121

期刊菜单

基于BP神经网络的自适应模糊半参数时间序列模型
Adaptive Fuzzy Semiparametric Time Series Model Based on BP Neural Network

DOI: 10.12677/MOS.2024.132121, PDF, HTML, XML,
作者: 聂景春^*, 陆秋君：上海理工大学理学院，上海
关键词: 模糊时间序列；自适应模糊回归；BP神经网络；模糊半参数时间序列模型；Fuzzy Time Series Model； Adaptive Fuzzy Regression Model； Back Propagation Neural Network (BPNN)； Fuzzy Semiparametric Time Series Model

摘要: 本文介绍了一种自适应模糊半参数时间序列模型，该模型将半参数技术与反向传播神经网络(BPNN)相结合，形成具有LR-型模糊数据的自适应模糊时间序列模型。首先，提出了基于非参数核、加权最小二乘和交叉验证的混合方法，该方法可以同时估计回归参数和光滑函数以及带宽的最优值；其次，基于非线性残差序列建立BP神经网络，通过神经网络的运算得到新的偏差，使得在不确定条件下获得更丰富的信息，提高了预测精度。本文采用一些常见的拟合优度准则来检验所提出的自适应模糊半参数时间序列模型的性能。通过一个模拟仿真的例子，说明了该方法的有效性。最后，对所得结果的统计分析表明，该模型对模糊时间序列数据的预测具有可靠性和有效性，优于其他模糊时间序列预测模型。

Abstract: In this paper we introduce a fuzzy semiparametric time series model aggregating semiparametric techniques and neural network into adaptive fuzzy time series model with LR-type fuzzy data. First, a hybrid approach including nonparametric kernel-based method, weighted least squares and cross-validation method is suggested, which could simultaneously estimate both regression param-eters and smooth function of the innovations along with optimal value of the bandwidth. Next, back propagation neural network (BPNN) is created based on the nonlinear residual sequence and then new deviations are attained as a result of operating with neural network, so that the richer infor-mation can be obtained under uncertain conditions and the prediction accuracy is improved. Some common goodness-of-fit criteria are employed to examine the performance of the proposed adap-tive fuzzy semiparametric time series model. A simulation example is given to illustrate the effec-tiveness of this method. Last, statistical analyses of obtained results indicate that the proposed model is reliable and effective for predicting fuzzy time series data and superior to other fuzzy time series forecasting models.

文章引用：聂景春, 陆秋君. 基于BP神经网络的自适应模糊半参数时间序列模型[J]. 建模与仿真, 2024, 13(2): 1295-1303. https://doi.org/10.12677/MOS.2024.132121

1. 引言

时间序列预测是基于过去时间序列值对数据集进行建模，这些数据集用于预测未来值。时间序列预测方法在商业、金融、计算机科学、工程、医学、物理、化学等许多跨学科领域都有广泛的应用。经典的时间序列分析评估在很大程度上是基于精确的信息。然而，在现实世界中，关于底层系统的一些信息可能是不精确的，并且以模糊量的形式表示。因此，有必要将经典方法推广到模糊环境中来研究和分析利益系统。对于这种情况，模糊时间序列模型在过去几十年中由于其在统计学和工程学中的广泛应用而获得了相当大的关注，例如招生 [1] ，股票指数价格 [2] ，温度 [3] ，财务预测 [4] 和农产品 [5] 等。

Song and Chissom [6] 最早提出了模糊时间序列的概念，并针对精确数据给出了模糊时间序列模型求解方法。模糊时间序列模型的求解主要由模糊化、模糊关系的建立和去模糊化等步骤组成。模糊逻辑关系的识别技术是求解模糊时间序列模型的重要一环，引起了许多研究者的兴趣，并得到了广泛的研究。模糊逻辑关系识别技术主要包括模糊逻辑关系群和模糊逻辑关系矩阵 [7] 、软计算技术 [8] 以及采用模糊逻辑的统计技术等 [9] 。

在许多实际问题中，模糊时间序列数据之间除了具有线性关系，一般还具有非线性关系。神经网络作为非线性映射的逼近器具有很高的能力 [10] 。因此，许多研究人员将神经网络与模糊时间序列结合起来，以达到更好的预测效果。Huarng和Yu [8] 提出了一种混合模型，结合反向传播神经网络与简单方法，实现了已知模式与未知模式分开预测，提高了预测精度。Khashei et al. [11] 将人工神经网络和模糊回归模型结合，提出了一种新的混合模型用于不完全数据条件下的时间序列预测。Egrioglu et al. [12] 提出了一种新的混合模糊时间序列方法，利用模糊c均值(FCM)方法和人工神经网络分别进行模糊化和去模糊化。Gu et al. [13] 提出了一种将信息颗粒划分方法与反向传播神经网络(BPNN)相结合的时间序列预测模型。

非参数技术在模糊时间序列预测中也被广泛应用。Hesamian和Akbari [14] 提出并讨论了一种基于非参数核的统计方法，对LR-型模糊时间序列数据进行了预测。然而，作为一种完全非参数的方法，它通常会导致一些缺点，如维数诅咒、解释困难和缺乏外推能力。模糊半参数回归模型通常比相应的模糊非参数回归模型更具优势和灵活性。Hesamian和Akbari [15] 提出了一个具有模糊数据、非模糊系数和模糊平滑函数的半参数时间序列模型。Zarei et al. [16] 对Hesamian和Akbari [15] 模型进行了拓展，对模糊数据采用了不同的距离度量。

本文结合非参数核方法、加权最小二乘法和BP神经网络，引入了基于BP神经网络的自适应模糊半参数时间序列模型。本文使用了半参数统计推断和加权最小二乘法，与使用最小二乘法的参数和非参数方法相比，通常会产生稳健性和灵活性的结果。此外，在不确定条件下，BP神经网络可以获得更丰富的信息和更高的预测精度。然后通过比较一些常见的拟合优度标准的结果来检验所提出方法的有效性和优点。为了进行比较研究，将所提出的模型与现有的一些模糊时间序列模型进行了仿真例子的比较。数值和比较结果表明，所提出的模型可以在模糊时间序列分析中提供足够准确的结果，并且可以抵消估计过程中可能出现的模糊异常值的破坏性影响。

本文的其余部分组织如下：第2节回顾了模糊数和模糊时间序列、模糊自回归分布滞后模型和模糊半参数时间序列模型的基本概念，这些概念对本文提出的方法至关重要。在第3节中，提出了一种基于BP神经网络的自适应模糊半参数时间序列模型。然后，给出了本文提出的迭代算法步骤，同时介绍了一些常见的拟合指标，来评估所提出模型的拟合效果。第4节利用模拟仿真的例子进行了一些比较研究，以验证所提出模型的可行性和有效性，并在最后一节给出了一些结论。

2. 预备知识

在本节中，我们将介绍模糊数和模糊时间序列、模糊自回归分布滞后模型、模糊半参数时间序列模型的基本概念。

2.1. 模糊数和模糊时间序列

给定论域 $ℝ$ ，模糊集 $\tilde{A}$ 由其隶属函数 $μ_{\tilde{A}} (x) : ℝ \to [0, 1]$ 定义，对于 $α \in [0, 1]$ ， ${x \in ℝ | \tilde{A} (x) \geq α}$ 称为模糊集 $\tilde{A}$ 的 $α$ -水平集，并记作 $A [α]$ ，区间表示为 $\tilde{A} [α] = [{\tilde{A}}_{α}^{L}, {\tilde{A}}_{α}^{U}]$ ，其中， ${\tilde{A}}_{α}^{L} = i n f {x : x \in \tilde{A} [α]}$ ， ${\tilde{A}}_{α}^{U} = s u p {x : x \in \tilde{A} [α]}$ 。如果对于 $\forall α \in [0, 1]$ ， $A [α]$ 是有限闭区间，则实数域 $ℝ$ 上的模糊集 $\tilde{A}$ 称为 $ℝ$ 上的一个模糊数 [17] 。

定义1 [17] LR-型模糊数 $\tilde{A}$ 由其隶属函数定义，通常表示为 $\tilde{A} = {(a; l_{a}, r_{a})}_{L R}$ ：

$μ_{\tilde{A}} (x) = {\begin{matrix} L (\frac{a - x}{l_{a}}), & x \leq a, \\ R (\frac{x - a}{u_{a}}), & x > a . \end{matrix}$ (1)

由上式可知，LR-型模糊数由中心值 $a \in ℝ$ ，左展形和右展形 $l_{a}, u_{a} \in ℝ^{+}$ ，严格递减的形状函数 $L, R : ℝ^{+} \to [0, 1]$ ，且 $L (0) = R (0) = 1$ 组成。当 $l_{a} = u_{a} = 0$ 时，LR型模糊数退化为清晰值 $a$ 。

当 $L = R$ 且 $l_{a} = u_{a} = s$ 时，LR-型模糊数为对称模糊数，记为 $\tilde{A} = {(a; s)}_{L}$ 。当形状函数 $L (x) = R (x) = \max {0, 1 - x}$ 时，LR-型模糊数为三角模糊数，记作 $\tilde{A} = {(a; l_{a}, u_{a})}_{T}$ ，若 $l_{a} = u_{a} = s$ ，LR-型模糊数为对称三角模糊数，记作 $\tilde{A} = {(a; s)}_{T}$ 。

定义2 [1] 设 $ℝ$ 的子集 $Y (t) (t = \dots, 0, 1, 2, \dots)$ 是定义在模糊集 $f_{j} (t) (j = 1, 2, \dots)$ 的论域， $F (t)$ 是 $f_{j} (t) (j = 1, 2, \dots)$ 的集合，则 $F (t)$ 称为 $Y (t) (t = \dots, 0, 1, 2, \dots)$ 上的模糊时间序列。

定义3 [18] 假设 $\tilde{A} = {(a; l_{a}, u_{a})}_{L R}$ 和 $\tilde{B} = {(b; l_{b}, u_{b})}_{L R}$ 是LR-型模糊数，则 $\tilde{A}$ 与 $\tilde{B}$ 之间偏差平方距离定义如下：

$d^{2} (\tilde{A}, \tilde{B}) = {(a - b)}^{2} + {(a - L l_{a}) - (b - L l_{b})}^{2} + {(a + R u_{a}) - (b + R u_{b})}^{2},$ (2)

其中， $L = \int_{0}^{1} L^{- 1} (w) d w, R = \int_{0}^{1} R^{- 1} (w) d w$ 。

当 $\tilde{A}$ 和 $\tilde{B}$ 是对称模糊数时，即 $L = R$ 且 $l_{a} = u_{a} = s_{a}$ ， $l_{b} = u_{b} = s_{b}$ ，距离定义为：

$d^{2} (\tilde{A}, \tilde{B}) = 3 {(a - b)}^{2} + 2 L^{2} {(s_{a} - s_{b})}^{2},$ (3)

特别地，当 $\tilde{A}$ 和 $\tilde{B}$ 是对称三角模糊数时，即 $L = R = \frac{1}{2}$ ，距离定义为：

$d^{2} (\tilde{A}, \tilde{B}) = 3 {(a - b)}^{2} + \frac{1}{2} {(s_{a} - s_{b})}^{2} .$ (4)

2.2. 模糊自回归分布滞后模型

考虑模糊时间序列 ${\tilde{Y}}_{t} (t = 1, 2, \dots)$ ， $X_{k} (k = 1, 2, \dots)$ ，其中 ${\tilde{Y}}_{t}$ 是响应变量， $X_{k}$ 是解释变量，那么模糊自回归分布滞后模型具体如下 [19] ：

${\tilde{Y}}_{t} = {\tilde{A}}_{0} + {\tilde{A}}_{1} t + \sum_{i = 1}^{p} {\tilde{θ}}_{i} Y_{t - i} + \sum_{j = 1}^{k} \sum_{I_{j} = 0}^{q_{j}} {\tilde{β}}_{j, I_{j}} X_{j, t - I_{j}} + {\tilde{ε}}_{t} = \tilde{A} Y_{t}^{*} + {\tilde{ε}}_{t} .$ (5)

其中， $Y_{t}^{*} = {[1 t Y_{t - i} X_{j, t - I_{j}}]}^{'}$ 是自变量向量， $Y_{t - i}$ 是 $Y_{t}$ 滞后 $i$ 阶的值， $\tilde{A} = {[{\tilde{A}}_{0} {\tilde{A}}_{1} {\tilde{θ}}_{i} {\tilde{β}}_{j, I_{j}}]}^{'}$ 是未知模糊系数向量，表示为对称三角模糊数，记作 $\tilde{A} = {(α, c)}_{T}$ ，其中 $α$ 为中心值， $c$ 为展形， ${\tilde{ε}}_{t}$ 是随机模糊误差项。

2.3. 模糊半参数时间序列模型

考虑模糊时间序列 ${\tilde{Y}}_{t} (t = 1, 2, \dots)$ ，则模糊半参数时间序列模型具体如下 [15] ：

${\tilde{Y}}_{t} = \sum_{i = 1}^{p} θ_{i} {\tilde{Y}}_{t - i} + \tilde{f} (τ_{t}) + {\tilde{ε}}_{t}, t = p + 1, p + 2, \dots, T .$ (6)

其中， $θ_{i} (i = 1, 2, \dots, p)$ 是待估计的实值系数， ${\tilde{Y}}_{t - i}$ 是 ${\tilde{Y}}_{t}$ 滞后 $i$ 阶的值， $\tilde{f} (τ_{t}) = {(f (τ_{t}); l_{f (τ_{t})}, r_{f (τ_{t})})}_{L R}$ 是未知的模糊光滑函数，且 $l_{f (τ_{t})}, r_{f (τ_{t})} \geq 0$ ， $τ_{t} = \frac{t}{T}$ 是协变量， ${\tilde{ε}}_{t} = {(ε_{t}; l_{ε_{t}}, r_{ε_{t}})}_{L R}$ 是随机模糊误差。

3. 建立模型

在本节中，我们结合神经网络和半参技术提出了自适应模糊时间序列模型，并给出了模型的算法步骤和拟合指标。

3.1. 基于BPNN的自适应模糊半参数时间序列模型

考虑一组模糊时间序列数据 ${\tilde{r}}_{t} (t = 1, 2, \dots, T)$ ，其中 ${\tilde{r}}_{t} = {(c_{t}; l_{t}, u_{t})}_{L R}$ 。我们考虑以下自适应模糊半参数时间序列模型：

${\begin{array}{l} c_{t} = α_{1} c_{t - 1} + α_{2} c_{t - 2} + \dots + α_{p} c_{t - p} + f (τ_{t}) + ε_{c, t}, \\ l_{t} = β_{0} + β_{1} l_{t - 1} + β_{2} l_{t - 2} + \dots + β_{q} l_{t - q} + γ_{1} {\hat{c}}_{t} + ε_{l, t}, \\ u_{t} = φ_{0} + φ_{1} r_{t - 1} + φ_{2} r_{t - 2} + \dots + φ_{m} r_{t - m} + γ_{2} {\hat{c}}_{t} + ε_{u, t}, t = k + 1, \dots, T \end{array}$ (7)

其中， $k = \max (p, q, m), α_{1}, \dots, α_{p}, β_{0}, β_{1}, \dots, β_{q}, γ_{1}, φ_{0}, φ_{1}, \dots, φ_{m}, γ_{2}$ 是模型中的未知实值系数， $ε_{c, t}, ε_{l, t}, ε_{u, t}$ 分别是中心，左展形，右展形的随机误差， ${\hat{c}}_{t}$ 是 $c_{t}$ 的估计值， $f (τ_{t})$ 是未知的光滑函数， $τ_{t} = \frac{t}{T}$ 是协变量。该模型基于三个子模型。第一个子模型结合非参，考虑了中心和其滞后阶之间的线性关系和标量 $t$ 之间的非线性关系，其他两个子模型在第一个模型的基础上分别考虑了左展形和右展形与其滞后阶和中心估计值 ${\hat{c}}_{t}$ 之间的线性关系。

根据Wang et al. [20] ，我们可以估计未知的光滑函数 $\hat{f} (τ_{t})$ ：

$\hat{f} (τ_{t}) = \sum_{j = k + 1}^{T} w_{j} (τ_{t}) (c_{j} - \sum_{l = 1}^{p} α_{l} c_{j - p}),$ (8)

其中， $w_{j} (τ_{t}) = \frac{\frac{1}{T h} K (\frac{τ_{j} - τ_{t}}{h})}{\frac{1}{T h} \sum_{j = k + 1}^{T} K (\frac{τ_{j} - τ_{t}}{h})},$ 且 $h > 0$ 为核函数 $K (\cdot)$ 的带宽。

将(6)式代入(5)对应的第一个子模型中，得到中心，左展形和右展形的估计值，记作 ${\hat{\tilde{r}}}_{t} = {({\hat{c}}_{t}; {\hat{l}}_{t}, {\hat{u}}_{t})}_{L R}$ ：

${\begin{array}{l} {\hat{c}}_{t} = \sum_{j = k + 1}^{T} w_{j} (τ_{t}) c_{j} + \sum_{l = 1}^{p} α_{l} (c_{t - l} - \sum_{j = k + 1}^{T} w_{j} (τ_{t}) c_{j - l}), \\ {\hat{l}}_{t} = β_{0} + β_{1} l_{t - 1} + β_{2} l_{t - 2} + \dots + β_{q} l_{t - q} + γ_{1} {\hat{c}}_{t}, \\ {\hat{u}}_{t} = φ_{0} + φ_{1} u_{t - 1} + φ_{2} u_{t - 2} + \dots + φ_{m} u_{t - m} + γ_{2} {\hat{c}}_{t}, t = k + 1, \dots, T \end{array}$ (9)

其次，采用加权最小二乘法，我们可以估计未知的实值系数 $α = (α_{1}, α_{2}, \dots, α_{p}),$ $β = (β_{0}, β_{1}, β_{2}, \dots, β_{q}),$ $φ = (φ_{0}, φ_{1}, φ_{2}, \dots, φ_{m}),$ $γ = (γ_{1}, γ_{2})$ ，具体如下：

$(\hat{α}, \hat{β}, \hat{φ}, \hat{γ}) = \underset{α \in ℝ^{p}, β \in ℝ^{q}, φ \in ℝ^{m}, γ \in ℝ^{2}}{a r g m i n} \sum_{t = k + 1}^{T} w_{t} d^{2} ({\tilde{r}}_{t}, {\hat{\tilde{r}}}_{t})$ (10)

其中， $d^{2} ({\tilde{r}}_{t}, {\hat{\tilde{r}}}_{t})$ 是 ${\hat{\tilde{r}}}_{t}$ 和 ${\tilde{r}}_{t}$ 之间偏差平方距离， $w_{t} = \frac{1}{1 + d^{2} ({\tilde{r}}_{t}, {\hat{\tilde{r}}}_{t})}$ 是第t个残差对应的权重，残差越大的时间序列数据，权重越小，这样可以减弱异常数据对模型的干扰。

实际的模糊时间序列数据除了具有线性特征，还一般具有非线性特征。神经网络模型具有较强的学习能力和数据处理能力，能够挖掘数据背后复杂的甚至难用数学形式描述的非线性关系 [10] 。神经网络模型种类很多，其中基于误差反向传播算法的多层前馈神经网络，即BP神经网络，是应用最广的一种神经网络模型。

因此，本文针对残差序列中隐含的原始序列中的非线性关系，考虑了一个三层BP神经网络来逼近这种非线性关系，其中包含输入层，隐藏层，和输出层。假设BP神经网络有n个输入，则这个残差序列关系可写成：

${\begin{array}{l} ε_{t} = f (ε_{t - 1}, ε_{ε_{t - 2}}, \dots, ε_{t - n}) + ε_{t}^{*}, \\ ε_{l, t} = g (ε_{l, t - 1}, ε_{l, t - 2}, \dots, ε_{l, t - n}) + ε_{l, t}^{*}, \\ ε_{u, t} = h (ε_{u, t - 1}, ε_{u, t - 2}, \dots, ε_{u, t - n}) + ε_{u, t}^{*} . \end{array}$ (11)

其中， $ε_{t} = c_{t} - {\hat{c}}_{t}$ ， $ε_{l, t} = l_{t} - {\hat{l}}_{t}$ ， $ε_{u, t} = u_{t} - {\hat{u}}_{t}$ 分别是自适应模糊半参数时间序列预测模型得到的中心、左展形和右展形的残差， $f$ ， $g$ ， $h$ 是由神经网络决定的非线性函数，一般为logistic函数，即， $ε_{t}^{*}$ ， $ε_{l, t}^{*}$ 和 $ε_{u, t}^{*}$ 分别是中心、左展形和右展形的随机误差。BP神经网络具体结构如图1所示：

Figure 1. Structure of three-layer BP neural network

图1. 三层BP神经网络结构

通过BP神经网络估计的中心、左展形和右展形的残差 $ε_{t}$ ， $ε_{l, t}$ 和 $ε_{u, t}$ 预测值分别记为 ${\hat{ε}}_{t}^{N N}$ ， ${\hat{ε}}_{l, t}^{N N}$ 和 ${\hat{ε}}_{u, t}^{N N}$ ，那么将基于半参技术和加权最小二乘的结果 ${\hat{\tilde{r}}}_{t} = {({\hat{c}}_{t}; {\hat{l}}_{t}, {\hat{u}}_{t})}_{L R}$ 与BP神经网络所得残差估计值结合，则可以得到基于BP神经网络的自适应模糊半参数时间序列模型的最终估计值 ${\hat{\tilde{r}}}_{t}^{*} = {({\hat{c}}_{t}^{*}; {\hat{l}}_{t}^{*}, {\hat{u}}_{t}^{*})}_{L R}$ ：

${\begin{array}{l} {\hat{c}}_{t}^{*} = {\hat{c}}_{t} + {\hat{ε}}_{t}^{N N}, \\ {\hat{l}}_{t}^{*} = {\hat{l}}_{t} + {\hat{ε}}_{l, t}^{N N}, \\ {\hat{u}}_{t}^{*} = {\hat{u}}_{t} + {\hat{ε}}_{u, t}^{N N}, t = k + n + 1, \dots, T \end{array}$ (12)

3.2. 估计未知参数的算法

为了估计模型中的未知系数和未知光滑函数，本文提出了以下迭代算法过程：

步骤1：选择一个核函数，选择一个滞后阶数 $p \in {1, 2, \dots, P}, P \in ℕ$ ， $q \in {1, 2, \dots, Q}, Q \in ℕ$ ， $m \in {1, 2, \dots, M}, M \in ℕ$ ，其中，中心，左展形和右展形的滞后阶数的上限由样本自相关系数决定；

步骤2：假定初始带宽 $h_{(0)} = 0.01$ ；

步骤3：利用初始带宽 $h_{(0)}$ 和式(8)计算此时未知系数 $α_{h (0)}, β_{h (0)}, φ_{(0)}, γ_{h (0)}$ ；

步骤4：计算CV值，当CV值达到下确界时，此时 $h_{(0)}$ 即为最优带宽 $h_{o p t}$ ，否则，令 $h_{(1)} = h_{(0)} + 0.01$ ，回到步骤3，重复以上步骤；

$C V (h_{(0)}) = \frac{1}{T - k} \sum_{t = k + 1}^{T} d^{2} ({\tilde{r}}_{t}, {\hat{\tilde{r}}}_{t}^{h_{(0)}}),$ (13)

其中， ${\hat{\tilde{r}}}_{t}^{h_{(0)}}$ 是中心，左展形和右展形滞后阶数为 $p, q, m$ ，带宽为 $h_{(0)}$ 时的 ${\tilde{r}}_{t}$ 的估计值。

步骤5：计算自适应模糊半参数时间序列模型的残差 ${\tilde{e}}_{t} = {(e_{t}; l_{e_{t}}, r_{e_{t}})}_{L R}$ ，然后基于BP神经网络得到 ${\hat{\tilde{e}}}_{t} = {({\hat{e}}_{t}; {\hat{l}}_{e_{t}}, {\hat{r}}_{e_{t}})}_{L R}$ ，并根据式(12)计算得出 ${\hat{\tilde{r}}}_{t}^{*} = {({\hat{c}}_{t}^{*}; {\hat{l}}_{t}^{*}, {\hat{r}}_{t}^{*})}_{L R}$ ；

步骤6：选择另一组滞后阶数 $p, q, m$ ，其中 $p \in {1, 2, \dots, P}, q \in {1, 2, \dots, Q}, m \in {1, 2, \dots, M},$ 其中 $P \in ℕ,$ $Q \in ℕ$ 且 $M \in ℕ$ 回到步骤2，并重复以上步骤，模型的拟合优度达到最大时就得了最优的系数估计值。

3.3. 模型评价

本文采用以下三个拟合指标来评价模糊时间序列模型的性能 [21] [22] ：

$G_{1} = \frac{\sum_{t = k + 1}^{T} \frac{1}{1 + E_{1} ({\hat{\tilde{r}}}_{t}, {\tilde{r}}_{t})}}{T - k}$ (14)

其中， $E_{1} ({\hat{\tilde{r}}}_{t}, {\tilde{r}}_{t}) = \int \frac{| {\hat{\tilde{r}}}_{t} (x) - {\tilde{r}}_{t} (x) |}{\int {\tilde{r}}_{t} (x) d x} d x$ ， $G_{1}$ 越大，说明模糊时间序列模型的观测值与估计值越接近。

$M D = \frac{\sum_{t = k + 1}^{T} E_{2} ({\hat{\tilde{r}}}_{t}, {\tilde{r}}_{t})}{T - k}$ (15)

其中， $E_{2} ({\hat{\tilde{r}}}_{t}, {\tilde{r}}_{t}) = \frac{1}{2 z} \sum_{j = 1}^{z} (| {\hat{\tilde{r}}}_{t}^{L} [α_{j}] - {\tilde{r}}_{t}^{L} [α_{j}] | + | {\hat{\tilde{r}}}_{t}^{U} [α_{j}] - {\tilde{r}}_{t}^{U} [α_{j}] |)$ ， $α_{1} < \dots < α_{z}$ 是[0, 1]的任意分区， ${\hat{\tilde{r}}}_{t}^{L} [α_{j}]$ 和 ${\hat{\tilde{r}}}_{t}^{U} [α_{j}]$ 是 ${\hat{\tilde{r}}}_{t}$ 的 $α$ -水平截集的左端点和右端点。MD越大，说明模糊时间序列模型的观测值与估计值的拟合效果越差。

$S ({\hat{\tilde{r}}}_{t}, {\tilde{r}}_{t}) = \frac{1}{T - k} \sum_{t = k + 1}^{T} S_{U I} ({\hat{\tilde{r}}}_{t}, {\tilde{r}}_{t})$ (16)

其中， $S_{U I} ({\hat{\tilde{r}}}_{t}, {\tilde{r}}_{t}) = \frac{C a r d ({\hat{\tilde{r}}}_{t} \cap {\tilde{r}}_{t})}{C a r d ({\hat{\tilde{r}}}_{t} \cup {\tilde{r}}_{t})}$ ， $\cap$ 和 $\cup$ 分别表示模糊数空间中的交集算子和并算子， $C a r d (\tilde{A})$ 表示 $\tilde{A}$ 的基数。贴近度S越大，说明模糊时间序列模型的观测值与估计值更接近，模型拟合效果越好。

4. 实证分析

在本节中，我们通过模拟仿真的例子来验证本文模型的可行性和有效性。考虑以下自适应模糊半参数时间序列模型生成的模拟模糊数据集样本，样本量为100：

${\begin{array}{l} c_{t} = 0.6 c_{t - 1} + f (τ_{t}) + ε_{c, t}, \\ l_{t} = 0.3 + 0.4 l_{t - 1} - 0.08 {\hat{c}}_{t} + ε_{l, t}, \\ u_{t} = 0.2 + 0.6 u_{t - 1} - 0.1 {\hat{c}}_{t} + ε_{u, t}, t = 2, 3, \dots, 100 \end{array}$ (17)

其中， $c_{1}$ ， $l_{1}$ 和 $u_{1}$ 分别是中心、左展形和右展形的初始值，并且 $c_{1} ~ N (0, 9)$ ， $l_{1}$ 和 $u_{1}$ 是来自 $U (0, 2)$ 的随机样本，误差项 $ε_{c, t} ~ N (0, 0.1)$ ， $ε_{l, t}$ 和 $ε_{u, t}$ 是来自 $U (0, 0.01)$ 的随机样本，光滑函数 $f (τ_{t}) = \sqrt{τ_{t} (1 - τ_{t})} \sin (\frac{0.2 π}{τ_{t} + 0.05})$ ，其中 $τ_{t} = \frac{t}{100}, t = 2, 3, \dots, 100$ 。

为了排除偶然性，我们将模型(18)拟合了1000次，以验证所提出模型具有可行性和有效性。同时，本文与Ozawa et al. [23] ，Li et al. [24] ，Hesamianand Akbari (2018) [15] 和Hesamianand Akbari (2022) [25] 提出的模型进行了比较。拟合优度均值比较结果见表1。从表1可以看出，本文提出的模型获得很好的拟合效果，具有可行性和明显的拟合优势。

图2描述了模糊预测值与模糊时间序列观测值的差异，模糊预测值与模糊时间序列观测值越接近，说明模型拟合效果越好。从图2可以看出，与其他四个模型相比，本文模型得到的模糊预测值与模糊时间序列的观测值最接近，偏差最小。

Table 1. The performances of various fuzzy time series models in example analysis

表1. 算例分析中各模糊时间序列模型的拟合指标

Figure 2. The observed and predicted values of each fuzzy time series model in example analysis

图2. 算例分析中各模糊时间序列模型输出的观测值和预测值

5. 结论

在许多时间序列建模中，与参数或非参数统计推断相比，半参数统计推断可能会产生稳健和灵活的结果。本文提出一种基于BP神经网络的自适应模糊时间序列半参数预测模型。该模型分别考虑了模糊数中心与其滞后阶之间的线性关系以及协变量之间的非线性关系，左展形和右展形和其滞后阶与中心估计值之间的关系。本文首次利用半参数技术建立了自适应回归模型中各元素之间的模糊关系。此外，基于非线性残差序列建立了BP神经网络，通过神经网络的运算得到了新的残差估计值，使得在模糊不确定条件下获得了更多的数据信息，提高了模型的预测精度。然后，本文采用一些常见的拟合优度准则，通过与现有模型的比较，验证了本文模型的可行性和有效性。最后，考虑多个异常值的组合存在的情况下，本文模型是否仍具有稳健性，将是以后研究的课题。

致谢

在此，我要感谢陆老师对这篇论文的指导。

NOTES

^*通讯作者。

参考文献

[1]	Song, Q. and Chissom, B.S. (1993) Fuzzy Time Series and Its Models. Fuzzy Sets and Systems, 54, 269-277. [Google Scholar] [CrossRef]
[2]	Guan, H., Dai, Z., Zhao, A. and He, J. (2018) A Novel Stock Fore-casting Model Based on High-Order-Fuzzy-Fluctuation Trends and Back Propagation Neural Network. PLOS ONE, 13, e0192366. [Google Scholar] [CrossRef] [PubMed]
[3]	Abhishekh Gautam, S.S. and Singh, S.R. (2018) A Refined Method of Forecasting Based on High-Order Intuitionistic Fuzzy Time Series Data. Progress in Artificial Intelligence, 7, 339-350. [Google Scholar] [CrossRef]
[4]	Cheng, C.H. and Chen, C.H. (2018) Fuzzy Time Series Model Based on Weighted Association Rule for Financial Market Forecasting. Expert Systems, 35, 23-30. [Google Scholar] [CrossRef]
[5]	Rahim, N.F., Othman, M., Sokkalingam, R. and Kadir, E.A. (2018) Forecasting Crude Palm Oil Prices Using Fuzzy Rule-Based Time Series Method. IEEE Access, 6, 32216-32224. [Google Scholar] [CrossRef]
[6]	Song, Q. and Chissom, B.S. (1993) Forecasting Enrollments with Fuzzy Time Series-Part I. Fuzzy Sets and Systems, 54, 1-9. [Google Scholar] [CrossRef]
[7]	Chen, S.M. (1996) Forecasting Enrollments Based on Fuzzy Time Series. Fuzzy Sets and Systems, 81, 311-319. [Google Scholar] [CrossRef]
[8]	Huarng, K. and Yu, T.H.K. (2006) The Application of Neural Net-works to Forecast Fuzzy Time Series. Physica A: Statistical Mechanics and Its Applications, 363, 481-491. [Google Scholar] [CrossRef]
[9]	Duru, O. and Bulut, E. (2014) A Non-Linear Clustering Method for Fuzzy Time Series: Histogram Damping Partition under the Optimized Cluster Paradox. Applied Soft Computing, 24, 742-748. [Google Scholar] [CrossRef]
[10]	熊志斌. 基于ARIMA与神经网络集成的GDP时间序列预测研究[J]. 数理统计与管理, 2011, 30(2): 306-314.
[11]	Khashei, M., Hejazi, S.R. and Bijari, M. (2008) A New Hybrid Artificial Neural Networks and Fuzzy Regression Model for Time Series Forecasting. Fuzzy Sets and Systems, 159, 769-786. [Google Scholar] [CrossRef]
[12]	Egrioglu, E., Aladag, C.H. and Yolcu, U. (2013) Fuzzy Time Series Fore-casting with a Novel Hybrid Approach Combining Fuzzy C-Means and Neural Networks. Expert Systems with Applications, 40, 854-857. [Google Scholar] [CrossRef]
[13]	Gu, L., Guo, H. and Liu, X. (2017) Fuzzy Time Series Forecasting Based on Information Granule and Neural Network. International Journal of Computational Science and Engineering, 15, 146-152. [Google Scholar] [CrossRef]
[14]	Hesamian, G. and Akbari, M.G. (2021) A Non-Parametric Model for Fuzzy Forecasting Time Series Data. Computational and Applied Mathematics, 40, Article No. 147. [Google Scholar] [CrossRef]
[15]	Hesamian, G. and Akbari, M.G. (2018) A Semiparametric Model for Time Series Based on Fuzzy Data. IEEE Transactions on Fuzzy Systems, 26, 2953-2966. [Google Scholar] [CrossRef]
[16]	Zarei, R., Akbari, M.G. and Chachi, J. (2020) Modeling Autoregres-sive Fuzzy Time Series Data Based on Semi- Parametric Methods. Soft Computing, 24, 7295-7304. [Google Scholar] [CrossRef]
[17]	Lee, K.H. (2005) First Course on Fuzzy Theory and Applications. Springer Science & Business Media, Berlin.
[18]	Coppi, R., D’Urso, P., Giordani, P. and Santoro, A. (2006). Least Squares Estimation of a Linear Regression Model with LR Fuzzy Response. Computational Statistics & Data Analysis, 51, 267-286.[CrossRef]
[19]	Eren, M. (2023) Fuzzy Autoregressive Distributed Lag Model-Based Forecasting. Fuzzy Sets and Systems, 459, 82-94. [Google Scholar] [CrossRef]
[20]	Wang, N., Zhang, W.X. and Mei, C.L. (2007) Fuzzy Nonparametric Re-gression Based on Local Linear Smoothing Technique. Information Sciences, 177, 3882-3900. [Google Scholar] [CrossRef]
[21]	Chen, S.P. and Dang, J.F. (2008) A Variable Spread Fuzzy Linear Regres-sion Model with Higher Explanatory Power and Forecasting Accuracy. Information Sciences, 178, 3973-3988. [Google Scholar] [CrossRef]
[22]	Kim, B. and Bishu, R.R. (1998) Evaluation of Fuzzy Linear Regression Models by Comparing Membership Functions. Fuzzy Sets and Systems, 100, 343-352. [Google Scholar] [CrossRef]
[23]	Ozawa, K., Niimura, T. and Nakashima, T. (1999) Fuzzy Time-Series Model of Electric Power Consumption. IEEE Canadian Conference on Electrical and Computer Engineering, 2, 1195-1198. [Google Scholar] [CrossRef]
[24]	李竹渝, 刘威仪, 王泰积. 金融资产收益率的模糊双线性回归[J]. 统计研究, 2009, 26(2): 68-73.
[25]	Hesamian, G. and Akbari, M.G. (2022) Fuzzy Time Series Model Using Weighted Least Square Estimation. Iranian Journal of Fuzzy Systems, 19, 63-81.

为你推荐

友情链接