基于分割的自适应特征提取诊断心音方法

doi:10.12677/CSA.2021.118210

期刊菜单

基于分割的自适应特征提取诊断心音方法
Segmentation-Based Adaptive Feature Extraction Methodology for Discriminating Heart Sounds

DOI: 10.12677/CSA.2021.118210, PDF, HTML, XML, 被引量
作者: 何沛光, 宋伟, 吴杰, 杨文博, 王昭君, 陈金博, 蔡垄源：南阳理工学院，河南南阳
关键词: 心音；心音分割；(CS₁)；(CS₂ )；短时修正希尔伯特变换；主成分分析法；Heart Sound； Heart Sound Segmentation； (CS₁)；(CS₂ )； STMHT； Principal Component Analysis

摘要: 针对心音特征具有随其可分割性而改变的性质，提出一种基于心音分割的自适应特征提取算法，进而创建一种创新型的心脏病诊断系统。其创新点主要体现在：基于短时修正希尔伯特变换的第一复杂心音(CS₁)，第二复杂心音(CS₂)或完整心音(CS)的自适应分割提取；基于分割心音的自适应频率特征FF1或FF2提取；基于主成分分析的多尺度特征[γ₁₁、γ₁₂]和[γ₂₁、γ₂₂、γ₂₃]降维处理。实现此研究目标的2个阶段概括为：① 自动统计分析两个连续峰值之间的时间间隔，以此来确定心音的可分割特性；② 基于心音分割的自适应特征提取以及降维处理。通过在线数据库和临床数据库中提取的心音特征的散点图对系统性能进行初步评估验证。

Abstract: An adaptive feature extraction algorithm based on heart sound segmentation is proposed to create an innovative heart disease diagnosis system, which based on the nature of heart sound features that change with their segment. The innovations of this methodology are primarily reflected in the automatic segmentation and extraction of the first complex heart sound (CS₁), the second complex heart sound (CS₂) or each cardiac sound (CS) based on the short-time modified Hilbert transform; adaptive frequency feature FF1 or FF2 extraction based on the segmented heart sounds; and dimensionality reduction of the multiscale features [γ₁₁、γ₁₂] and [γ₂₁、γ₂₂、γ₂₃] based on principal component analysis. The two phases of this study are summarized as: ① automatic statistical analysis of the time interval between two consecutive peaks to determine the segmental characteristics of the heart sounds; ② adaptive feature extraction and dimensionality reduction based on heart sound segmentation. A preliminary evaluation of the performance of the system is validated by scatter plots of heart sound features extracted from the online and clinical databases.

文章引用：何沛光, 宋伟, 吴杰, 杨文博, 王昭君, 陈金博, 蔡垄源. 基于分割的自适应特征提取诊断心音方法[J]. 计算机科学与应用, 2021, 11(8): 2051-2063. https://doi.org/10.12677/CSA.2021.118210

1. 引言

心血管疾病(CVD)是全球头号死亡原因，估计每年夺走1790万人的生命 [1]。因此，心血管疾病的防治已成为迫在眉睫的公共卫生问题。尽管经胸壁超声心动图是诊断心血管疾病的黄金标准，但它的成本高昂，检查时间长(约为1小时) [2]。此外，由于声学窗口的限制，图像质量可能会降低 [3]。而心音诊断心血管疾病是一种无创、简单、经济、有效的方法，广泛应用于室间隔缺损(VSD)诊断 [4]、先天性心脏病诊断 [5]、儿童先天性心脏病筛查 [6] 等。正常的心音主要由两个基本心音组成：第一个心音S₁ 和第二个心音S₂ 。然而单纯性杂音，如收缩期射血杂音或全收缩期杂音(如二尖瓣返流(MR))，大部分出现在S₁和S₂之间，具有不同的杂音模式 [7]。在心音分类中，S₁、S₂ 以及S₁ 和S₂ 之间的特征提取起着重要的作用，因为这些区域提供不同的信息。然而，对于某些类型的心脏病，如主动脉瓣狭窄(AS)、二尖瓣狭窄(MS)和主动脉瓣反流(AR)，心音不能被分割而提取特征。因此，为了获得更有效的心音特征，需要根据能否分割心音来定义其自适应特征。

现有的心音分割研究分为两个分支。其中一个分支旨在将每个心动周期划分为四个基本阶段的序列，如图1所示，来自研究 [8] [9]：S₁ →收缩期→S₂ →舒张期，这些基本阶段很容易将正常心音划分。然而，由于现实环境中异常心音和背景噪声(包括真实环境中的杂音等人工噪声)的非平稳性，心脏周期声音难以分割为四个阶段的序列。另一个分支使用两种不同的方法进行划分。1) 对可进一步分割的心音，周期不是分为四个阶段(S₁ →收缩→S₂ →舒张)而是将其表达为两个心音阶段的一个序列，如图3(C)所示。2) 相反而言，如图3(A)所示，通过STMHT算法将给定的心音分割成完整的周期心音(表示为 $C S_{i}, i = 1, 2, \dots, N$ )，该方法对6种心脏病(总音长5640 s)、正常情况(总音长600 s)和密歇根大学心音库(总音长1444 s)的平均准确率达到97.4% [10]，并成功地应用于心音的自动分割以提取特征诊断心脏病，如室间隔缺损(VSD) [11] 和几种心脏病 [10]。此外，研究 [10] 指出，频域特征比时域特征更能有效区分正常声音和异常声音。由于二次频率成分的存在，某些心脏病的诊断准确率远低于正常心音的诊断准确率。此外，由于二次频率分量的不足或幅度较低，很多正常声音的二次频率分量特征提取比较复杂。因此，首先需要考虑基于分割的自适应频率特征对给定心音的拟合。

Figure 1. Example of a heart sound showing the sequence of four fundamental stages: first heart sound (S₁), Systole period, S₂, and Diastole period

图1. 心音示例，显示四个基本阶段的顺序：第一个心音(S₁)，心动周期，S₂和舒张期

作为一种有效的特征提取方法，包络线的频率维数超过给定的阈值(Thv )已被证实用于检测心脏病 [10] [11] [12] [13]。例如，研究 [13] 表明，在 $T h v = 0.8$ 时诊断MR的最高分类准确率为96.9%，在 $T h v = 0.3$ 时检测AR的最高分类准确率为93.9%。然而，据报道，在 $T h v = 0.2$ 时，诊断VSD的最高分类准确率为98.5% [11]。此外，对于许多类型的心音，由于包络不光滑，在不合适的频率范围内难以提取频率宽度。为了在不改变Thv 的情况下提取平滑包络的频率宽度，通过研究 [10] 提出了一种称为二次包络的平滑包络，并利用STMHT算法自动提取频率特征矩阵FFM；该方法已被证明能够成功检测不同类型的心脏病，包括主动脉反流(AR)、AS和MR。然而，对于MS和MR相关的声音，由于缺少二次频率成分，特征矩阵FFM不易提取。因此，为提高诊断更多类型心脏病的分类准确率，简化诊断方法的复杂性，基于分割的自适应频率特征对给定心音的拟实现如下：1) 对于可以分割为CS₁ 和CS₂ 的心音，在频域上提取CS₁ 和CS₂ 的二次包络，然后自动提取阈值 $T h v = 0.3, 0.5, 0.8$ 对应的频率宽度。2) 相反，提取CS 的二次包络，然后自动提取与阈值Thv = 0.2:0.1:0.9相对应的频率宽度。最后，将有效的特征分类方法应用于心脏病诊断。

综上所述，本研究提出了一种基于数据统计分析的自适应型研究方法。其主要贡献如下：1) 根据给定心音在时域上的特点，通过STMHT算法将其分割为CS₁ 和CS₂ 或CS；2) 引入二次曲线的新方法，在频域中自动提取CS₁ 和CS₂ 或CS；3) 自适应提取特征来区分心音。本文的其余部分组织如下，第二部分介绍了可被分割成完整心音CS的 $[γ_{11}, γ_{12}]$ 和可被分割成CS₁ 和CS₂ 的心音的 $[γ_{21}, γ_{22}, γ_{23}]$ 的诊断特征的生成和确定，并定义了基于置信度区域的诊断方法。第三部分讨论了该方法的性能，通过散点图方法对在线心音数据库中的声音和临床心脏病中的声音进行了评价。最后在第四节给出了结论。

2. 方法

如图2，与该方法相对应的三个阶段可以概括为：1) 根据两个序列峰值之间的时间间隔自动计算并统计分析，确定给定的心音是否能被分割；2) 自动提取基于分割的自适应特征，使心音适应到频域；3)基于高斯混合模型(GMM)的分类器用于诊断给定的心音。以下各节将描述这些阶段的功能。

2.1. 第一阶段：自动计算 $\sum_{i = 1}^{N} P I_{i} / N$

2.1.1. HS的预处理

为消除心音采集过程中产生的背景噪声干扰，对心音信号进行预处理。根据研究 [4] [10] [11] 报道，心音主要分散在20~700 Hz的频率范围内。因此，根据采样频率(Fs = 44.1 kHz)，基于小波分解(WD)的心音(HS)滤波，采集有效频率分量(21.5~689 Hz)。在之前研究 [14] 中发现，Daubechies小波10 (dB10)能给出心音的最大信噪比和最小均方根误差。因此，我们选择dB10作为母小波进行心音预处理。在接下来小节中，我们使用经过滤波和归一化处理心音，提取其包络，记作HS_T 如图2所示。

Figure 2. Flow chart of the proposed three-stage innovative diagnostic system methodology

图2. 提出的三阶段创新诊断方法论流程图

2.1.2. HS特征提取

研究 [10] [11] 报道，基于Viola积分的包络提取心音在频率域特征值表示为HS_E，即从心音中提取的HS_T 。它不仅能有效应对振幅变化，而且能有效应对复杂背景和噪声。这一想法如下所述，假设一个数据序列 $H S_{T} [m]$ 经过WD预处理， $m = 0, 1, \dots, M - 1$ ，其中M 为HSs的个数。在时间m的W_m 邻域内，称为宽度W 时间标度，m 点包络线 $H S_{E} [m]$ 由公式(1)获得

$H S_{E} [M] = \frac{1}{2 W_{m} + 1} \sum_{K = m - W_{m}}^{m + W_{m}} (H S_{T} [k] - \bar{H S_{T}} {[m]}^{2}), m = W_{m}, W_{m} + 1, \dots, M - 1 - W_{m}$ (1)

其中

$\bar{H S_{T}} [m] = \frac{1}{2 W_{m} + 1} \sum_{K = m - W_{m}}^{m + W_{m}} H S_{T} [k]$ (2)

由于S₁ 或S₂ 的持续时间大于0.1 s，在本研究中设置为W_m = 2205。最后，通过将HS_E 的最大幅度设置为1 (如图1)来进行归一化。

2.1.3. HS_STMHT 提取

据报道，STMHT在心音分割 [4] [10] [11] 中展现出极大的优势，其描述如下：给定M点心音信号， $H S [m] (m = 0, 1, \dots, M - 1)$ ，则HS的STMHT $H S_{STMHT}$ 由公式(3)计算

$H S_{STMHT} [n] = \sum_{m = n - \frac{N - 1}{2}}^{n + \frac{N - 1}{2}} H S_{E} W_{N} [m - n] W_{E} [m - (n - \frac{N - 1}{2})]$ (3)

其中 $n = (N - 1) / 2, (N + 1) / 2, \dots, M - 1 - (N - 1) / 2$ ， $W_{N} [l] (l = - (N - 1) / 2, - (N - 1) / 2 + 1, \dots, (N - 1) / 2)$ 是指具有奇数长度N 的移动窗口，

$W_{E} [i] = {\begin{cases} \frac{\cos (\frac{N - 1 - 2 i}{2 N} π) - \cos (\frac{N - 1 - 2 i}{2} π)}{N \sin (\frac{N - 1 - 2 i}{2 N} π)}, for i = 0, 1, \dots, N - 1 \\ 0, for i = \frac{N - 1}{2} \end{cases}$ (4)

2.1.4. 峰值和分割点的自动定位

成功应用于研究 [4] [11] 的HS_STMHT 对心音包络HS_E 的特征可表征为如图3所示：

※ 可以用HS_STMHT 从负到正(N2P)点自动定位HS_E 的几何中心峰(用•标记) (图3(A)和图3(C))。

※ 标记为•的分割点可以通过HS_STMHT 的正负(P2N)点确定(图3(A)和图3(C))。

由于特征提取方法通常基于是否可以将每个心动周期声音分割为S₁ 或S₂ ，因此可以通过计算HS的两个相邻峰值之间的时间间隔(在图2中用PI表示3A和C)来评估HS的分割特性。此外，为了提高分割判断的准确性，将单个PI 替换为PI 统计计算，表示为

$μ_{P T} = \frac{\sum_{i = 1}^{N} P I_{i}}{N}$ (5)

其中N 是 $P I_{s}$ 的个数，i 是 $P I_{i}$ 的索引。

2.2. 第二阶段：自适应特征生成

2.2.1. 自动提取CS 或CS₁ 和CS₂

由于一个心动周期中S₁ 和S₂ 之间的间隔小于0.58 ms，因此从S₂ 到S₁ 的时间间隔(所谓的收缩时间间隔)通常大于从一个周期心音中的S₁ 到S₂ (舒张时间间隔) [17] [18] [19]。因此，可以使用平均PI确定是否将给定的心音分割为每个心动周期CS 或CS₁ 和CS₂ ，并且可以使用 $P I_{i}$ 和 $P I_{i + 1}$ 的比较来定位CS₁ 和CS₂ ，这在算法1中进行了详细说明，并使用AR进行了说明来自图3(A)中数据库 [20] 的声音和来自图3(C)中数据库 [16] 的正常声音。

Figure 3. The automatic CS₁ & CS₂ and CS identifications and extraction procedures. A~B plot the procedure for an example of a typical aortic regurgitation sound (AR) from Database [15]. C~D plot the procedure for an example from a typical normal sound (NM) from heart sounds and murmurs [16]

图3. CS₁、CS₂和CS的自动识别和提取程序。A~B为数据库 [15] 中典型的主动脉瓣反流声(AR)的例子绘制了程序。C~D为典型的正常声音(NM)的程序，该例子来自于心脏声音和杂音 [16]

2.2.2. 二次包络的自动提取

研究 [10] 提出的二次包络已被证明是一种有效的提取心脏病 [10] [12] 频率特征的方法。为了降低二次包络计算的计算复杂度，研究 [21] 提出了一种简单有效的二次包络计算方法。总结如下，给定一个时域m 点心音信号，可以通过公式(6)计算频域二次包络HS_F

$H S_{F_{E}} = \frac{\sum_{l_{1}} (L_{1} + L_{2} + 1 - | l_{1} |) H S_{F} [k + l_{1}] - \sum_{l_{2}} H S_{F} [k + L_{2}]}{(2 L_{1} + 1) (2 L_{2} + 1)}$ (6)

其中，HS_p是时域m 点心音信号对应的频率分量，由公式(7)定义

${\begin{cases} l_{1} = - (L_{1} + L_{2}), - (L_{1} + L_{2}) + 1, \dots, (L_{1} + L_{2}) \\ l_{2} = - (L_{1} - L_{2} - 1), - (L_{1} - L_{2} - 1) + 1, \dots, (L_{1} - L_{2} - 1) \\ H S_{F} [k] = | \sum_{m = 0}^{M - 1} H S_{T} [m + 1] e^{(- j \frac{2 π k l}{M})} |, k = 0, 1, 2, \dots, M - 1 \end{cases}$ (7)

$| . |$ 为绝对值号， $2 L_{1} + 1$ 为第一个窗宽，设为705,600/F_s + 1， $2 L_{2} + 1$ 为第二个窗宽，根据研究 [10] [21] 设为1,543,500/F_s。 $H S_{F_{E}}$ 也被归一化

$H S_{F_{E}} = \frac{H S_{F_{E}}}{\max (H S_{F_{E}})}$ (8)

图4(A)和图4(B)中以正常声音为例说明了与CS₁ 和CS₂ ，CS_1F 和CS_2F 以及用于CS_1F 和CS_2F的二次包络相对应的频率分量。图4(A)显示了CS₁ (黄色)和CS₂ (青色)首先是根据算法1自动提取频率分量。然后，通过等式计算频率分量CS_1F (黄色)和CS_2F (黄色)。公式(7)并绘制在图4(B)中。最后，通过等式提取围绕CS_1E 和CS_2E 的二次包络CS_1E 。公式(6)并在图4(B)中显示。相似地，基于算法1提取围绕CS_F 的二次包络CS_E ，如图4(C)和图4(D)所示。在以下小节中，定义了CS、CS₁ 和CS₂ 的基于二次包络的频率特征，并使用阈值自动将其提取为诊断特征线法。

Figure 4. Example of frequency feature (FF) definition and automatic extraction

图4. 频率特征(FF)定义和自动提取的例子

2.2.3. 频率特征FF₁ 和FF₂ 的提取率

基于二次包络的频宽度在给定阈值上已被验证对心脏杂音 [10] 的检测和VSDs [12] 的诊断是有用的。然而，对于许多其他心脏病来说，提取Thv 较小或较大的频率宽度是困难的。大量的实验对几种心脏病的数据进行处理，频率特征如图4(B)和图4(D)所示，计算其重力(记为F1_G 、F2_G 和F_G)

${\begin{cases} F 1_{G} = \frac{\sum_{k = 0}^{M - 1} k \times C S_{1 E} [k]}{\sum_{k = 0}^{M - 1} C S_{1 E} [k]} \\ F 2_{G} = \frac{\sum_{k = 0}^{M - 1} k \times C S_{2 E} [k]}{\sum_{k = 0}^{M - 1} C S_{2 E} [k]} \\ F_{G} = \frac{\sum_{k = 0}^{M - 1} k \times C S_{E} [k]}{\sum_{k = 0}^{M - 1} C S_{E} [k]} \end{cases}$ (9)

它们的峰(表示为F_P)位于

$F_{p} = a r g m a x \times C S_{E} [m]$ (10)

此外，频率宽度(表示为F_Thv₁(Thv1 = 0.2:0.1:0.9)，F1_Thv₂和F2_Thv₂ (Thv2 = 分别在给定阈值上定义0.3、0.5、0.8)。

${\begin{cases} F_{T h v 1} = R_{T h v 1} - L_{T h v 1} \\ F 1_{T h v 2} = R 1_{T h v 2} - L 1_{T h v 2} \\ F 2_{T h v 2} = R 2_{T h v 2} - L 2_{T h v 2} \end{cases}$ (11)

其中L_Thv₁和R_Thv₁是阈值线Thv1上CS_E的左右交集，L1_Thv₁和R1_Thv₁是阈值线Thv2上CS_1E的左右交集，L2_Thv₂和R2_Thv₂是CS_2E的左右交集分别超过阈值线Thv2。因此，对于被分割为CS的给定HS的频率特征被表示为FF₁，并且被分割为CS₁和CS₂的给定心音的频率特征由等式表示为FF₂，公式(12)，如图4所示。

${\begin{cases} F F_{1} = [F_{0.2}, F_{0.3}, F_{0.4}, F_{0.5}, F_{0.6}, F_{0.7}, F_{0.8}, F_{0.9}, F_{G}, F_{P}] \\ F F_{2} = [F 1_{0.3}, F 1_{0.5}, F 1_{0.8}, F 2_{0.3}, F 2_{0.5}, F 2_{0.8}, F 1_{G}, F 2_{G}] \end{cases}$ (12)

2.2.4. 诊断特征确定

实验数据：对两组声音数据进行分析。第一个包含无法分割为CS₁ 和CS₂ 但可以分割为CS 的声音，包括176周期的AR声音(Medical Sound Library [20] 和AR Rated Medicine [22] )，152周期的AS声音(Medical Sound Library [20] [23] )，232周期主动脉间隔缺陷(ASD)声音(Auscultation Sound [24]，Heart sounds-ASD [25] 和ThinkLabs Database [26] )和256周期MR声音(Last Second Medicine [27] 和Easy Auscultation [28] )。另一种是可分割为CS₁ 和CS₂ 的，包括665周期的AR音(3M database [29]，Medical Sound Library [20]，Heart Auscultation Sounds [30]，Auscultation Sound [24]，Continuing Medical Implementation [15]，Sounds Database of the University of Dundee [16] 和南阳市中心医院仅AR的患者(所有程序均由南阳市中心医院当地伦理委员会批准。所有患者均已获悉实验性质，并获得知情同意书是从所有患者父母那里获得的，对此十分感谢他们所提供的数据)，381周期的AS声音(Continuing medical implementation [15]，Sounds Database of the University of Dundee [16]，3M database [29]，Medical Sound Library [20]，Auscultation sound [24]，只有主动脉瓣关闭不全的南阳中心医院患者心脏听诊音 [30] 和Heart Auscultation Sounds [29]，315周期ASD声音(Medical Sound Library [20]，Heart Auscultation Sounds [30]，3M database [29] )，南阳市中心医院仅主动脉瓣关闭不全的患者心脏听诊音和Medical Sound Library [20] )，769周期MR声音(3M database [29]，Sounds Database of the University of Dundee [16]，Heart Auscultation Sounds [30]，Medical Sound Library [20] 和Auscultation Sound [24] )，439周期MS声音(3M database [29]，Auscultation Sound [24]，Medical Sound Library [20] 和Continuing Medical Implementation [15] )以及1056周期的NM声音(3M database [29] ，Michigan Database [31]，Medical Sound Library [20]，ThinkLabs Database [26] 和南阳理工学院的健康本科生(经南阳理工学院当地医学伦理委员会批准。已从所有大学生那里获得了书面知情同意书，十分感谢他们所提供的数据)。而且，特征的箱型图绘制在图5中，其中图5和图6示出了箱形图。图5(A)和图5(B)示出了从心脏病中提取的特征，这些特征只能在每个心动周期声音中被分割，包括AR，AS，ASD和MR。图5(C)示出了从CS₁ 提取的特征，而图5(D)示出了从每种心脏病的CS₂ 提取的特征。从图5的方框图中可以看出，使用这些功能来区分不同心脏病的示例如下：

① 用F_0.2和F_0.3，可以使ASD很容易与其他心音区分开，如图5(A)所示。

② 图5(B)表示使用功能F_G和F_P可以轻松将AS与其他心音区分开。

③ 通过使用F1_0.3 (图5(C))，很容易将MS和VSD声音与其他心音区分开。

④ 使用功能F2_0.5 (图5(D))，AR和VSD可以与其他心音区分开。

Figure 5. Box plots of the features extracted from each type of heart disease. A and B show the box plots of features extracted from CS, and the features extracted from CS₁ and CS₂ are shown in C and D

图5. 从各类型心脏病中提取的特征的箱形图。A和B为从CS中提取的特征的箱形图，C和D为从CS₁和CS₂中提取的特征

因此，结合使用公式(12)定义的几个功能可以将每种心脏病与其他心脏病区分开。此外，为了简化特征并使诊断方法更简单，更有效，接下来考虑用于确定新特征的尺寸减小。

特征确定：主成分分析(PCA)是一种线性降维技术，为了简化利用特征诊断心脏病时的计算，在很多研究中，如心律失常分级 [32] 的研究中，使用少量的主成分来替换高维数据。利用心脏病分类 [4] [33]、情绪识别 [34]、呼吸频率提取 [35] 和基于心电图的心脏病诊断 [36]，生成一些有效的主成分来表征心音特征，用于心脏病诊断。该算法对应于对给定数据集X通过PCA生成新特征描述为算法2。

为了确定主成分的最小数目m，帕累托图提供了一种可视化帕累托原理的工具，它指出，影响一个共同结果的一组小问题往往比其余问题发生得更频繁，并被用来表示由每个主成分解释的变异百分比(图6(A))。因此，根据最小的m值，即 $η_{Σ} (m) > 80 %$ [37] 结合前m个主成分的散点图，确定最小的m。特征FF₁的PCA分析结果的帕累托图显示了每个主成分的解释方差和累积方差 $γ_{1 i}, i = 1, 2, \dots$ 的PCA分析结果的帕累托图特征FF₂如图6(C)所示。由图6(A)和图6(B)所描述的主成分；由FF₁生成，图6(C)~(E)表示主成分； $γ_{2 i} (i = 1, \dots, 8)$ ，主成分分析如下：

1) 对于 $γ_{1 i} (i = 1, 2, \dots, 9, 10)$ ， $γ_{11}$ 和 $γ_{12}$ 导致一个维度减少了80% (从10个变量减少到2个变量)，而信息损失仅为11.1%。进一步确定使用 $γ_{11}$ 和 $γ_{12}$ 作为诊断功能来区分无法分割的不同类型的心音使用所提出的方法，提供了图6(B)中的 $γ_{11}$ 和 $γ_{12}$ 的散布图。从图6(B)中可以明显看出，使用 $γ_{11}$ 和 $γ_{12}$ 可以有效地区分每种类型的心脏病，因为与每种类型的心脏病相对应的分布区域明显不同，除了MR和AR之间略有重叠。

2) 对于 $γ_{21 i} (i = 1, 2, \dots, 8)$ ，① 尽管 $γ_{21}$ 和 $γ_{22}$ 导致维度减少了75% (从8到2个变量)，而信息损失仅为32.42%，但图6(D)中 $γ_{21}$ 和 $γ_{22}$ 的散点图表明重叠，其中(MS、ASD、NM、AS)略大，难以利用其特征准确区分各类型疾病。② 然而，图6(E)为 $γ_{21}$ 、 $γ_{22}$ 、 $γ_{23}$ 的散点图。显示每种类型的心脏病都有不同的分布区域。另外， $η_{Σ} (3) > 86.73 %$ ，如图6(C)所示，进行特征值的确定。

因此， $γ_{11}$ 和 $γ_{12}$ 被用作诊断没有被分割成CS₁和CS₂而是被分割成CS的心音的最终特征，而特征 $γ_{21}$ 、 $γ_{22}$ 和 $γ_{23}$ (见图6(E))被用来诊断可以被分割成CS₁和CS₂的心脏病。

Figure 6. PCA results. A shows the Pareto chart of the variance contributed by each principal component $γ_{1 i} (i = 1, 2, \dots, 10)$ , and B plots the scatter diagram of the first two components $γ_{11}$ and $γ_{12}$ ; C shows the Pareto chart of the variance contributed by each principal component $γ_{2 i} (i = 1, 2, \dots, 8)$ , and D plots the scatter diagram of the first two components $γ_{21}$ and $γ_{22}$ . The scatter diagram of the first three components $γ_{21}$ , $γ_{22}$ and $γ_{23}$ is shown in E

图6. 主成分分析结果。A显示了每个主成分 $γ_{1 i} (i = 1, 2, \dots, 10)$ 的方差帕累托图，B绘制前两个分量 $γ_{11}$ 和 $γ_{12}$ 的散点图；C表示各主成分 $γ_{2 i} (i = 1, 2, \dots, 8)$ 的方差帕累托图。D绘制前两个分量 $γ_{21}$ 和 $γ_{22}$ 的散点图。前三个组分 $γ_{21}$ ， $γ_{22}$ 和 $γ_{23}$ 的散点图见E

3. 系统性能评估

该方法的性能通过2.2.4节中描述的特征[ $γ_{11}$ , $γ_{12}$ ]和[ $γ_{21}$ , $γ_{22}$ , $γ_{23}$ ]的散点图来评估。如图6(B)和图6(E)所示，散点图显示如下：

1) 图6(B)中给出的 $γ_{11}$ 和 $γ_{12}$ 的散点图表明，除MR和AR之间略有重叠外，每种心脏病对应的分布区域明显不同；

2) 每种类型的心脏病都有不同的分布区域，如图6(E)所示，特别是ASD、MR和AR疾病的特征；

3) 因此，使用特征[ $γ_{11}$ ， $γ_{12}$ ]和[ $γ_{21}$ ， $γ_{22}$ ， $γ_{23}$ ]可以有效地区分不同的心脏病，例如MR、MS、ASD、NM、AS、AR和室间隔缺损。

4. 总结

提出了一种具有较高分类精度的心脏病诊断新方法，其创新之处主要体现在：1) 第一复合心音CS₁和第二复合心音CS₂或每个完整心动周期CS的自动分割和提取；2) 基于分割的自适应频率特征FF₁和FF₂的自动提取，以及基于主成分分析的诊断特征的确定[ $γ_{11}$ , $γ_{12}$ ]和[ $γ_{21}$ , $γ_{22}$ , $γ_{23}$ ]。分两个阶段进行描述诊断系统：第一阶段包括自动计算心音两个连续峰值之间的间隔的样本平均值，用于确定给定的心音是否可以分割。在第二阶段，首先提出了一种新的方法，分别自动生成二次包络CS_1E和CS_2E或CS_E，使分割特征适应频域，然后根据阈值线自动提取FF₁和FF₂。最后，将主成分分析得到的前两个主成分[ $γ_{11}$ , $γ_{12}$ ]和前三个主成分[ $γ_{21}$ , $γ_{22}$ , $γ_{23}$ ]分别作为未分割声音和分割声音的诊断特征。使用来自在线心音数据库的声音和来自临床心脏数据库的声音来验证关于特征的性能评估。因此，本文提出的自适应特征方法为区分七种心脏疾病提供了一种有效的方法。

参考文献

[1]	WHO (2020) Cardiovascular Diseases. https://www.who.int/health-topics/cardiovascular-diseases/#tab=tab_1
[2]	Malik, A.S., Boyko, O., Atkar, N. and Young, W.F. (2001) A Comparative Study of MR Imaging Profile of Titanium Pedicle Screws. Acta Radiologica, 42, 291-293. [Google Scholar] [CrossRef]
[3]	Vos, T., Barber, R.M., Bell, B., et al. (2015) Global, Regional, and National Incidence, Prevalence, and Years Lived with Disability for 301 Acute and Chronic Dis-eases and Injuries in 188 Countries, 1990-2013: A Systematic Analysis for the Global Burden of Disease Study 2013. The Lancet, 386, 743-800. [Google Scholar] [CrossRef]
[4]	Sun, S., Wang, H., Chang, Z., Mao, B. and Liu, Y. (2019) On the Mahalanobis Distance Classification Criterion for a Ventricular Septal Defect Diagnosis System. IEEE Sensors Journal, 19, 2665-2674. [Google Scholar] [CrossRef]
[5]	谭朝文, 王威廉, 宗容, 潘家华, 杨宏波. 基于卷积神经网络的先心病心音信号分类算法[J]. 生物医学工程学杂志, 2019, 36(5): 728-736, 744. [Google Scholar] [CrossRef] [PubMed]
[6]	Notario, P.M., Gentile, E., Amidon, M., Angst, D., Lefaiver, C. and Webster, K. (2019) Home-Based Telemedicine for Children with Medical Complexity. Telemedicine and e-Health, 25, 1123-1132. [Google Scholar] [CrossRef] [PubMed]
[7]	Coviello, J.S. (2013) Auscultation Skills: Breath & Heart Sounds. 5th Edition, Lippincott Williams & Wilkins, Philadelphia.
[8]	Liu, Q., Wu, X. and Ma, X. (2018) An Automatic Segmentation Method for Heart Sounds. BioMedical Engineering OnLine, 17, Article No. 106. [Google Scholar] [CrossRef] [PubMed]
[9]	Messner, E., Zöhrer, M. and Pernkopf, F. (2018) Heart Sound Segmentation—Anevent Detection Approach Using Deep Recurrent Neural Networks. IEEE Transactions on Biomedi-cal Engineering, 65, 1964-1974. [Google Scholar] [CrossRef]
[10]	Sun, S.P. (2015) An Innovative Intelligent System Based on Automatic Diagnostic Feature Extraction for Diagnosing Heart Diseases. Knowledge-Based Systems, 75, 224-238. [Google Scholar] [CrossRef]
[11]	Sun, S. and Wang, H. (2018) Principal Component Analy-sis-Based Features Generation Combined with Ellipse Models-Based Classification Criterion for a Ventricular Septal Defect Diagnosis System. Australasian Physical & Engineering Sciences in Medicine, 41, 821-836. http://link.springer.com/10.1007/s13246-018-0676-1 [Google Scholar] [CrossRef] [PubMed]
[12]	Sun, S., Wang, H., Jiang, Z., Fang, Y. and Tao, T. (2014) Seg-mentation-Based Heart Sound Feature Extraction Combined with Classifier Models for a VSD Diagnosis System. Expert Systems with Applications, 41, 1769-1780. http://www.sciencedirect.com/science/article/pii/S0957417413006970 [Google Scholar] [CrossRef]
[13]	Choi, S. and Jiang, Z. (2010) Cardiac Sound Murmurs Classifica-tion with Autoregressive Spectral Analysis and Multi-Support Vector Machine Technique. Computers in Biology and Medicine, 40, 8-20. http://www.sciencedirect.com/science/article/pii/S0010482509001796 [Google Scholar] [CrossRef] [PubMed]
[14]	Ali, M.N., El Dahshan, E.-S.A. and Yahia, A.H. (2017) Denoising of Heart Sound Signals Using Discrete Wavelet Transform. Circuits, Systems, and Signal Processing, 36, 4482-4497. [Google Scholar] [CrossRef]
[15]	Continuing Medical Implementation (2019) Heart Sounds Databases-Continuing Medical Implementation. http://www.cvtoolbox.com/index.html
[16]	MacWalter, D. and MacWalter, G. (2019) Human Heart Sounds and Mur-murs. https://libguides.dundee.ac.uk/medicine/databases
[17]	Máttar, J.A., Shoemaker, W.C., Diament, D., Lomar, A., Lopes, A.C., De Freitas, E., Stella, F.P. and Factore, L.A. (1991) Systolic and Diastolic Time Intervals in the Critically Ill Patient. Critical Care Medicine, 19, 1382-1386. http://www.ncbi.nlm.nih.gov/pubmed/1935158 [Google Scholar] [CrossRef] [PubMed]
[18]	Yeo, T.C., Dujardin, K.S., Tei, C., Mahoney, D.W., McGoon, M.D. and Seward, J.B. (1998) Value of a Doppler-Derived Index Combining Systolic and Diastolic Time In-tervals in Predicting Outcome in Primary Pulmonary Hypertension. The American Journal of Cardiology, 81, 1157-1161. http://www.sciencedirect.com/science/article/pii/S0002914998001404 [Google Scholar] [CrossRef]
[19]	Cui, W., Roberson, D.A., Chen, Z., Madro-nero, L.F. and Cuneo, B.F. (2008) Systolic and Diastolic Time Intervals Measured from Doppler Tissue Imaging: Nor-mal Values and Z-Score Tables, and Effects of Age, Heart Rate, and Body Surface Area. Journal of the American Society of Echocardiography, 21, 361-370. http://www.sciencedirect.com/science/article/pii/S0894731707004403
[20]	Medical Sound Library (2019) Auscultate: Learn Heart Sounds, Murmurs and Medical Auscultation. https://www.medzcool.com/auscultate
[21]	Sun, S. (2020) A Novel Method-Based Secondary Envelope Extraction for Heart Sound Analysis.
[22]	Solanki, D.S. (2020) Aortic Regurgitation. Rated Medicine. https://ratedmedicine.wordpress.com/aortic-regurgitation/
[23]	AMBOSS (2020) AMBOSS: Medical Knowledge Distilled YouTube. https://www.youtube.com/channel/UC8xEQrU6VhJU6pDZd-GkJWg
[24]	Auscultation Sound (2019) Heart Murmur-Mitral Regurgitation Auscultation Sound!!! Complete. https://www.medzcool.com/auscultate
[25]	Patkar, R. (2020) Heart Sounds: Atrial Septal Defect. https://www.youtube.com/watch?v=bArVgcBgp4M
[26]	Thinklabs (2019) Thinklabs Heart Sound Library. https://www.thinklabs.com/heart-sounds?hclocation=ufi
[27]	Last Second Medicine (2017). https://www.youtube.com/channel/UCPnja4taYSqY8Ydk1W4fN8w
[28]	Easy Auscultation (2021) Easy Auscul-tation Training—Heart and Lung Sounds. https://www.easyauscultation.com/
[29]	3M Database (2019) 50 Heart and Lung Sounds Library. http://solutions.3m.com/wps/portal/3M/enEU/3M-Littmann-EMEA/stethoscope/littmann-learning-institute/heart-lung-sounds/heart-lung-sound-library/
[30]	AMBOSSMed (2019) AMBOSS: Medical Knowledge Distilled. https://www.medzcool.com/auscultate
[31]	Heart Sound & Murmur Library (2019). http://www.med.umich.edu/lrc/psb/heartsounds/index.htm
[32]	Mohseni, S.S. and Mohamadyari, M. (2016) Heart Ar-rhythmias Classification via a Sequential Classifier Using Neural Network, Principal Component Analysis and Heart Rate Variation. 2016 IEEE 8th International Conference on Intelligent Systems, Sofia, 4-6 September 2016, 715-722. [Google Scholar] [CrossRef]
[33]	Kavitha, R. and Kannan, E. (2016) An Efficient Framework for Heart Disease Classification Using Feature Extraction and Feature Selection Technique in Data Mining. Proceedings of the 1st International Conference on Emerging Trends in Engineering, Technology and Science, Pudukkottai, 24-26 Feb-ruary 2016, 1-5. [Google Scholar] [CrossRef]
[34]	Guo, H.-W., Huang, Y.-S., Lin, C.-H., Chien, J.-C., Haraikawa, K. and Shieh, J.-S. (2016) Heart Rate Variability Signal Features for Emotion Recognition by Using Principal Component Analysis and Support Vectors Machine. 2016 IEEE 16th International Conference on Bioinformatics and Bioengineering, Taichung, 31 October-2 November 2016, 274-277. [Google Scholar] [CrossRef]
[35]	Motin, M.A., Karmakar, C.K. and Palaniswami, M. (2018) Prin-cipal Component Analysis: A Novel Approach for Extracting Respiratory Rate and Heart Rate from Photoplethysmo-graphic Signal. IEEE Journal of Biomedical and Health Informatics, 22, 766-774. [Google Scholar] [CrossRef]
[36]	El-Saadawy, H., Tantawi, M., Shedeed, H.A. and Tolba, M.F. (2017) Electrocardiogram (ECG) Heart Disease Diagnosis Using PNN, SVM and Softmax Regression Classifiers. 2017 8th International Conference on Intelligent Computing and Information Systems, Cairo, 5-7 December 2017, 106-110. [Google Scholar] [CrossRef]
[37]	Johnson, R.A. and Wichern, D.W. (2007) Applied Multi-variate Statistical Analysis. 6th Edition, Pearson, London. http://docshare04.docshare.tips/files/12598/125983744.pdf

为你推荐

友情链接