1. 引言
心血管疾病(CVD)是全球头号死亡原因,估计每年夺走1790万人的生命 [1]。因此,心血管疾病的防治已成为迫在眉睫的公共卫生问题。尽管经胸壁超声心动图是诊断心血管疾病的黄金标准,但它的成本高昂,检查时间长(约为1小时) [2]。此外,由于声学窗口的限制,图像质量可能会降低 [3]。而心音诊断心血管疾病是一种无创、简单、经济、有效的方法,广泛应用于室间隔缺损(VSD)诊断 [4]、先天性心脏病诊断 [5]、儿童先天性心脏病筛查 [6] 等。正常的心音主要由两个基本心音组成:第一个心音S1 和第二个心音S2 。然而单纯性杂音,如收缩期射血杂音或全收缩期杂音(如二尖瓣返流(MR)),大部分出现在S1和S2之间,具有不同的杂音模式 [7]。在心音分类中,S1、S2 以及S1 和S2 之间的特征提取起着重要的作用,因为这些区域提供不同的信息。然而,对于某些类型的心脏病,如主动脉瓣狭窄(AS)、二尖瓣狭窄(MS)和主动脉瓣反流(AR),心音不能被分割而提取特征。因此,为了获得更有效的心音特征,需要根据能否分割心音来定义其自适应特征。
现有的心音分割研究分为两个分支。其中一个分支旨在将每个心动周期划分为四个基本阶段的序列,如图1所示,来自研究 [8] [9]:S1 →收缩期→S2 →舒张期,这些基本阶段很容易将正常心音划分。然而,由于现实环境中异常心音和背景噪声(包括真实环境中的杂音等人工噪声)的非平稳性,心脏周期声音难以分割为四个阶段的序列。另一个分支使用两种不同的方法进行划分。1) 对可进一步分割的心音,周期不是分为四个阶段(S1 →收缩→S2 →舒张)而是将其表达为两个心音阶段的一个序列,如图3(C)所示。2) 相反而言,如图3(A)所示,通过STMHT算法将给定的心音分割成完整的周期心音(表示为
),该方法对6种心脏病(总音长5640 s)、正常情况(总音长600 s)和密歇根大学心音库(总音长1444 s)的平均准确率达到97.4% [10],并成功地应用于心音的自动分割以提取特征诊断心脏病,如室间隔缺损(VSD) [11] 和几种心脏病 [10]。此外,研究 [10] 指出,频域特征比时域特征更能有效区分正常声音和异常声音。由于二次频率成分的存在,某些心脏病的诊断准确率远低于正常心音的诊断准确率。此外,由于二次频率分量的不足或幅度较低,很多正常声音的二次频率分量特征提取比较复杂。因此,首先需要考虑基于分割的自适应频率特征对给定心音的拟合。
![](//html.hanspub.org/file/4-1542194x30_hanspub.png?20210809133001673)
Figure 1. Example of a heart sound showing the sequence of four fundamental stages: first heart sound (S1), Systole period, S2, and Diastole period
图1. 心音示例,显示四个基本阶段的顺序:第一个心音(S1),心动周期,S2和舒张期
作为一种有效的特征提取方法,包络线的频率维数超过给定的阈值(Thv )已被证实用于检测心脏病 [10] [11] [12] [13]。例如,研究 [13] 表明,在
时诊断MR的最高分类准确率为96.9%,在
时检测AR的最高分类准确率为93.9%。然而,据报道,在
时,诊断VSD的最高分类准确率为98.5% [11]。此外,对于许多类型的心音,由于包络不光滑,在不合适的频率范围内难以提取频率宽度。为了在不改变Thv 的情况下提取平滑包络的频率宽度,通过研究 [10] 提出了一种称为二次包络的平滑包络,并利用STMHT算法自动提取频率特征矩阵FFM;该方法已被证明能够成功检测不同类型的心脏病,包括主动脉反流(AR)、AS和MR。然而,对于MS和MR相关的声音,由于缺少二次频率成分,特征矩阵FFM不易提取。因此,为提高诊断更多类型心脏病的分类准确率,简化诊断方法的复杂性,基于分割的自适应频率特征对给定心音的拟实现如下:1) 对于可以分割为CS1 和CS2 的心音,在频域上提取CS1 和CS2 的二次包络,然后自动提取阈值
对应的频率宽度。2) 相反,提取CS 的二次包络,然后自动提取与阈值Thv = 0.2:0.1:0.9相对应的频率宽度。最后,将有效的特征分类方法应用于心脏病诊断。
综上所述,本研究提出了一种基于数据统计分析的自适应型研究方法。其主要贡献如下:1) 根据给定心音在时域上的特点,通过STMHT算法将其分割为CS1 和CS2 或CS;2) 引入二次曲线的新方法,在频域中自动提取CS1 和CS2 或CS;3) 自适应提取特征来区分心音。本文的其余部分组织如下,第二部分介绍了可被分割成完整心音CS的
和可被分割成CS1 和CS2 的心音的
的诊断特征的生成和确定,并定义了基于置信度区域的诊断方法。第三部分讨论了该方法的性能,通过散点图方法对在线心音数据库中的声音和临床心脏病中的声音进行了评价。最后在第四节给出了结论。
2. 方法
如图2,与该方法相对应的三个阶段可以概括为:1) 根据两个序列峰值之间的时间间隔自动计算并统计分析,确定给定的心音是否能被分割;2) 自动提取基于分割的自适应特征,使心音适应到频域;3)基于高斯混合模型(GMM)的分类器用于诊断给定的心音。以下各节将描述这些阶段的功能。
2.1. 第一阶段:自动计算
2.1.1. HS的预处理
为消除心音采集过程中产生的背景噪声干扰,对心音信号进行预处理。根据研究 [4] [10] [11] 报道,心音主要分散在20~700 Hz的频率范围内。因此,根据采样频率(Fs = 44.1 kHz),基于小波分解(WD)的心音(HS)滤波,采集有效频率分量(21.5~689 Hz)。在之前研究 [14] 中发现,Daubechies小波10 (dB10)能给出心音的最大信噪比和最小均方根误差。因此,我们选择dB10作为母小波进行心音预处理。在接下来小节中,我们使用经过滤波和归一化处理心音,提取其包络,记作HST 如图2所示。
![](//html.hanspub.org/file/4-1542194x38_hanspub.png?20210809133001673)
Figure 2. Flow chart of the proposed three-stage innovative diagnostic system methodology
图2. 提出的三阶段创新诊断方法论流程图
2.1.2. HS特征提取
研究 [10] [11] 报道,基于Viola积分的包络提取心音在频率域特征值表示为HSE,即从心音中提取的HST 。它不仅能有效应对振幅变化,而且能有效应对复杂背景和噪声。这一想法如下所述,假设一个数据序列
经过WD预处理,
,其中M 为HSs的个数。在时间m的Wm 邻域内,称为宽度W 时间标度,m 点包络线
由公式(1)获得
(1)
其中
(2)
由于S1 或S2 的持续时间大于0.1 s,在本研究中设置为Wm = 2205。最后,通过将HSE 的最大幅度设置为1 (如图1)来进行归一化。
2.1.3. HSSTMHT 提取
据报道,STMHT在心音分割 [4] [10] [11] 中展现出极大的优势,其描述如下:给定M点心音信号,
,则HS的STMHT
由公式(3)计算
(3)
其中
,
是指具有奇数长度N 的移动窗口,
(4)
2.1.4. 峰值和分割点的自动定位
成功应用于研究 [4] [11] 的HSSTMHT 对心音包络HSE 的特征可表征为如图3所示:
※ 可以用HSSTMHT 从负到正(N2P)点自动定位HSE 的几何中心峰(用•标记) (图3(A)和图3(C))。
※ 标记为•的分割点可以通过HSSTMHT 的正负(P2N)点确定(图3(A)和图3(C))。
由于特征提取方法通常基于是否可以将每个心动周期声音分割为S1 或S2 ,因此可以通过计算HS的两个相邻峰值之间的时间间隔(在图2中用PI表示3A和C)来评估HS的分割特性。此外,为了提高分割判断的准确性,将单个PI 替换为PI 统计计算,表示为
(5)
其中N 是
的个数,i 是
的索引。
2.2. 第二阶段:自适应特征生成
2.2.1. 自动提取CS 或CS1 和CS2
由于一个心动周期中S1 和S2 之间的间隔小于0.58 ms,因此从S2 到S1 的时间间隔(所谓的收缩时间间隔)通常大于从一个周期心音中的S1 到S2 (舒张时间间隔) [17] [18] [19]。因此,可以使用平均PI确定是否将给定的心音分割为每个心动周期CS 或CS1 和CS2 ,并且可以使用
和
的比较来定位CS1 和CS2 ,这在算法1中进行了详细说明,并使用AR进行了说明来自图3(A)中数据库 [20] 的声音和来自图3(C)中数据库 [16] 的正常声音。
![](//html.hanspub.org/file/4-1542194x55_hanspub.png?20210809133001673)
Figure 3. The automatic CS1 & CS2 and CS identifications and extraction procedures. A~B plot the procedure for an example of a typical aortic regurgitation sound (AR) from Database [15]. C~D plot the procedure for an example from a typical normal sound (NM) from heart sounds and murmurs [16]
图3. CS1、CS2和CS的自动识别和提取程序。A~B为数据库 [15] 中典型的主动脉瓣反流声(AR)的例子绘制了程序。C~D为典型的正常声音(NM)的程序,该例子来自于心脏声音和杂音 [16]
2.2.2. 二次包络的自动提取
研究 [10] 提出的二次包络已被证明是一种有效的提取心脏病 [10] [12] 频率特征的方法。为了降低二次包络计算的计算复杂度,研究 [21] 提出了一种简单有效的二次包络计算方法。总结如下,给定一个时域m 点心音信号,可以通过公式(6)计算频域二次包络HSF
(6)
其中,HSp是时域m 点心音信号对应的频率分量,由公式(7)定义
(7)
为绝对值号,
为第一个窗宽,设为705,600/Fs + 1,
为第二个窗宽,根据研究 [10] [21] 设为1,543,500/Fs。
也被归一化
(8)
图4(A)和图4(B)中以正常声音为例说明了与CS1 和CS2 ,CS1F 和CS2F 以及用于CS1F 和CS2F的二次包络相对应的频率分量。图4(A)显示了CS1 (黄色)和CS2 (青色)首先是根据算法1自动提取频率分量。然后,通过等式计算频率分量CS1F (黄色)和CS2F (黄色)。公式(7)并绘制在图4(B)中。最后,通过等式提取围绕CS1E 和CS2E 的二次包络CS1E 。公式(6)并在图4(B)中显示。相似地,基于算法1提取围绕CSF 的二次包络CSE ,如图4(C)和图4(D)所示。在以下小节中,定义了CS、CS1 和CS2 的基于二次包络的频率特征,并使用阈值自动将其提取为诊断特征线法。
![](//html.hanspub.org/file/4-1542194x63_hanspub.png?20210809133001673)
Figure 4. Example of frequency feature (FF) definition and automatic extraction
图4. 频率特征(FF)定义和自动提取的例子
2.2.3. 频率特征FF1 和FF2 的提取率
基于二次包络的频宽度在给定阈值上已被验证对心脏杂音 [10] 的检测和VSDs [12] 的诊断是有用的。然而,对于许多其他心脏病来说,提取Thv 较小或较大的频率宽度是困难的。大量的实验对几种心脏病的数据进行处理,频率特征如图4(B)和图4(D)所示,计算其重力(记为F1G 、F2G 和FG)
(9)
它们的峰(表示为FP)位于
(10)
此外,频率宽度(表示为FThv1(Thv1 = 0.2:0.1:0.9),F1Thv2和F2Thv2 (Thv2 = 分别在给定阈值上定义0.3、0.5、0.8)。
(11)
其中LThv1和RThv1是阈值线Thv1上CSE的左右交集,L1Thv1和R1Thv1是阈值线Thv2上CS1E的左右交集,L2Thv2和R2Thv2是CS2E的左右交集分别超过阈值线Thv2。因此,对于被分割为CS的给定HS的频率特征被表示为FF1,并且被分割为CS1和CS2的给定心音的频率特征由等式表示为FF2,公式(12),如图4所示。
(12)
2.2.4. 诊断特征确定
实验数据:对两组声音数据进行分析。第一个包含无法分割为CS1 和CS2 但可以分割为CS 的声音,包括176周期的AR声音(Medical Sound Library [20] 和AR Rated Medicine [22] ),152周期的AS声音(Medical Sound Library [20] [23] ),232周期主动脉间隔缺陷(ASD)声音(Auscultation Sound [24],Heart sounds-ASD [25] 和ThinkLabs Database [26] )和256周期MR声音(Last Second Medicine [27] 和Easy Auscultation [28] )。另一种是可分割为CS1 和CS2 的,包括665周期的AR音(3M database [29],Medical Sound Library [20],Heart Auscultation Sounds [30],Auscultation Sound [24],Continuing Medical Implementation [15],Sounds Database of the University of Dundee [16] 和南阳市中心医院仅AR的患者(所有程序均由南阳市中心医院当地伦理委员会批准。所有患者均已获悉实验性质,并获得知情同意书是从所有患者父母那里获得的,对此十分感谢他们所提供的数据),381周期的AS声音(Continuing medical implementation [15],Sounds Database of the University of Dundee [16],3M database [29],Medical Sound Library [20],Auscultation sound [24],只有主动脉瓣关闭不全的南阳中心医院患者心脏听诊音 [30] 和Heart Auscultation Sounds [29],315周期ASD声音(Medical Sound Library [20],Heart Auscultation Sounds [30],3M database [29] ),南阳市中心医院仅主动脉瓣关闭不全的患者心脏听诊音和Medical Sound Library [20] ),769周期MR声音(3M database [29],Sounds Database of the University of Dundee [16],Heart Auscultation Sounds [30],Medical Sound Library [20] 和Auscultation Sound [24] ),439周期MS声音(3M database [29],Auscultation Sound [24],Medical Sound Library [20] 和Continuing Medical Implementation [15] )以及1056周期的NM声音(3M database [29] ,Michigan Database [31],Medical Sound Library [20],ThinkLabs Database [26] 和南阳理工学院的健康本科生(经南阳理工学院当地医学伦理委员会批准。已从所有大学生那里获得了书面知情同意书,十分感谢他们所提供的数据)。而且,特征的箱型图绘制在图5中,其中图5和图6示出了箱形图。图5(A)和图5(B)示出了从心脏病中提取的特征,这些特征只能在每个心动周期声音中被分割,包括AR,AS,ASD和MR。图5(C)示出了从CS1 提取的特征,而图5(D)示出了从每种心脏病的CS2 提取的特征。从图5的方框图中可以看出,使用这些功能来区分不同心脏病的示例如下:
① 用F0.2和F0.3,可以使ASD很容易与其他心音区分开,如图5(A)所示。
② 图5(B)表示使用功能FG和FP可以轻松将AS与其他心音区分开。
③ 通过使用F10.3 (图5(C)),很容易将MS和VSD声音与其他心音区分开。
④ 使用功能F20.5 (图5(D)),AR和VSD可以与其他心音区分开。
![](//html.hanspub.org/file/4-1542194x80_hanspub.png?20210809133001673)
Figure 5. Box plots of the features extracted from each type of heart disease. A and B show the box plots of features extracted from CS, and the features extracted from CS1 and CS2 are shown in C and D
图5. 从各类型心脏病中提取的特征的箱形图。A和B为从CS中提取的特征的箱形图,C和D为从CS1和CS2中提取的特征
因此,结合使用公式(12)定义的几个功能可以将每种心脏病与其他心脏病区分开。此外,为了简化特征并使诊断方法更简单,更有效,接下来考虑用于确定新特征的尺寸减小。
特征确定:主成分分析(PCA)是一种线性降维技术,为了简化利用特征诊断心脏病时的计算,在很多研究中,如心律失常分级 [32] 的研究中,使用少量的主成分来替换高维数据。利用心脏病分类 [4] [33]、情绪识别 [34]、呼吸频率提取 [35] 和基于心电图的心脏病诊断 [36],生成一些有效的主成分来表征心音特征,用于心脏病诊断。该算法对应于对给定数据集X通过PCA生成新特征描述为算法2。
为了确定主成分的最小数目m,帕累托图提供了一种可视化帕累托原理的工具,它指出,影响一个共同结果的一组小问题往往比其余问题发生得更频繁,并被用来表示由每个主成分解释的变异百分比(图6(A))。因此,根据最小的m值,即
[37] 结合前m个主成分的散点图,确定最小的m。特征FF1的PCA分析结果的帕累托图显示了每个主成分的解释方差和累积方差
的PCA分析结果的帕累托图特征FF2如图6(C)所示。由图6(A)和图6(B)所描述的主成分;由FF1生成,图6(C)~(E)表示主成分;
,主成分分析如下:
1) 对于
,
和
导致一个维度减少了80% (从10个变量减少到2个变量),而信息损失仅为11.1%。进一步确定使用
和
作为诊断功能来区分无法分割的不同类型的心音使用所提出的方法,提供了图6(B)中的
和
的散布图。从图6(B)中可以明显看出,使用
和
可以有效地区分每种类型的心脏病,因为与每种类型的心脏病相对应的分布区域明显不同,除了MR和AR之间略有重叠。
2) 对于
,① 尽管
和
导致维度减少了75% (从8到2个变量),而信息损失仅为32.42%,但图6(D)中
和
的散点图表明重叠,其中(MS、ASD、NM、AS)略大,难以利用其特征准确区分各类型疾病。② 然而,图6(E)为
、
、
的散点图。显示每种类型的心脏病都有不同的分布区域。另外,
,如图6(C)所示,进行特征值的确定。
因此,
和
被用作诊断没有被分割成CS1和CS2而是被分割成CS的心音的最终特征,而特征
、
和
(见图6(E))被用来诊断可以被分割成CS1和CS2的心脏病。
![](//html.hanspub.org/file/4-1542194x123_hanspub.png?20210809133001673)
Figure 6. PCA results. A shows the Pareto chart of the variance contributed by each principal component
, and B plots the scatter diagram of the first two components
and
; C shows the Pareto chart of the variance contributed by each principal component
, and D plots the scatter diagram of the first two components
and
. The scatter diagram of the first three components
,
and
is shown in E
图6. 主成分分析结果。A显示了每个主成分
的方差帕累托图,B绘制前两个分量
和
的散点图;C表示各主成分
的方差帕累托图。D绘制前两个分量
和
的散点图。前三个组分
,
和
的散点图见E
3. 系统性能评估
该方法的性能通过2.2.4节中描述的特征[
,
]和[
,
,
]的散点图来评估。如图6(B)和图6(E)所示,散点图显示如下:
1) 图6(B)中给出的
和
的散点图表明,除MR和AR之间略有重叠外,每种心脏病对应的分布区域明显不同;
2) 每种类型的心脏病都有不同的分布区域,如图6(E)所示,特别是ASD、MR和AR疾病的特征;
3) 因此,使用特征[
,
]和[
,
,
]可以有效地区分不同的心脏病,例如MR、MS、ASD、NM、AS、AR和室间隔缺损。
4. 总结
提出了一种具有较高分类精度的心脏病诊断新方法,其创新之处主要体现在:1) 第一复合心音CS1和第二复合心音CS2或每个完整心动周期CS的自动分割和提取;2) 基于分割的自适应频率特征FF1和FF2的自动提取,以及基于主成分分析的诊断特征的确定[
,
]和[
,
,
]。分两个阶段进行描述诊断系统:第一阶段包括自动计算心音两个连续峰值之间的间隔的样本平均值,用于确定给定的心音是否可以分割。在第二阶段,首先提出了一种新的方法,分别自动生成二次包络CS1E和CS2E或CSE,使分割特征适应频域,然后根据阈值线自动提取FF1和FF2。最后,将主成分分析得到的前两个主成分[
,
]和前三个主成分[
,
,
]分别作为未分割声音和分割声音的诊断特征。使用来自在线心音数据库的声音和来自临床心脏数据库的声音来验证关于特征的性能评估。因此,本文提出的自适应特征方法为区分七种心脏疾病提供了一种有效的方法。