1. 引言
长期以来,肝纤维化的诊断是以穿刺病理活检作为金标准,但其具有创伤性并存在一定的并发症,患者不易接受,且评估肝纤维化的分期,可能存在样本误差,出现假阴性的结果。无创性的影像学检查在肝脏病变的诊断中发挥了重要作用,但超声、CT和磁共振成像(MRI)等之前的影像学技术,所获得的肝脏体积、脾脏厚度、门静脉主干宽度等信息都是肝硬化后期的变化,无法反映早期的改变,更无法分级。因此,随着MRI硬件和软件技术的不断发展和完善,利用医学知识与计算机图像处理技术进行定量分析,进而构建医学影像基础上的计算机辅助诊断系统具有重要的理论意义与临床应用价值。
纹理特征是从纹理图像中计算出来的一个值,它对纹理内部灰度级变化的特征进行量化 [1] 。特征提取在广义上就是一种变换,即通过变换的方法用低维空间表示高维的图像样本空间 [2] 。纹理作为图像灰度的分布模式,是图像的一个极为重要的特征 [3] 。近年来,诸多国内外学者利用图像的纹理特征对各系统疾病进行研究。如曹桂涛等 [4] 基于任意的肝脏超声图像提出了利用纹理边缘共生矩阵(TECM)进行纤维化量化分析的方法,首先由Canny算子提取纹理边缘,并计算其共生矩阵的熵作为分类的特征;陶振中 [5] 等利用Man junath BS提出的方法,对肝部CT图像进行纹理特征和边缘形状提取,效果良好;H. S. Sheshadri [6] 等运用统计方法计算纹理特征值,确定了乳房X片的六个纹理特征,从而清楚地展现乳房组织中的异常生长形态。D. Jirak等 [7] 采用一阶和二阶纹理特征对肝部MRI T2图像进行分析,实现了对肝硬化和正常肝组织的区分;Jafar. i Khouzani [8] 等用MRI图像的小波纹理特征对正常与病理海马组织进行区分,获得许多有价值信息,从而有助于医生对癫痫病的诊断;K. Sho ji等 [9] 对70例周围型肺小结节提取纹理特征,发现恶性结节的分维数值大于良性结节;Taleb-Ahmed等 [10] 用分形几何模型分析图像的骨纹理特征,结果表明女性骨质疏松的骨图像与健康控制组骨的骨图像分维数不同。从而为进一步定量分析骨质疏松疾病打下了基础;蒋勇等 [11] 采用差分盒计算方法对人体肺部纹理特征进行研究,发现正常组织和肺部癌变组织CT图像之间分形维数存在一定程度的差别。
由于医学图像纹理具有较大复杂性的特点,目前还不存在适合各类医学图像的通用纹理提取与分析方法,因而根据各类不同特点的医学图像,寻求最佳的模型分类方法及检验方式,寻找最优的纹理特征与纹理参数构建最佳的计算机辅助诊断模型是当前研究的重点和难点。我们通过对大量采集的MR和CT图像数据进行肝纤维化纹理特征量的解析,找出了计算机辅助肝纤维化诊断的最佳参数 [11] 。
本文第二节介绍分类诊断实验,第三节实验数据统计及分析,第四节是结论。
2. 分类诊断实验
当前肝纤维化诊断实验研究的重点是寻求一套最优的计算机辅助诊断方案,而目前在寻求最优诊断方案的研究当中除了对核心诊断算法的优化研究之外,医学图像特征信息的优化选择,其中包括特征量的优化选取,提取特征量区域的ROI尺寸优化等都是提高诊断效率的重要参数。本次实验是基于肝脏纤维化MRI图像和CT图像的计算机辅助诊断实验,对由GLCM提取的特征量做优化选择分析,还有分析计算GLCM的三种ROI尺寸对诊断效果的影响。本次实验首次获得了医学图像特征量选择、ROI尺寸的指导性结论。
2.1. 实验材料的提取
2.1.1.
医学图像材料
本次实验所采用的医学图片全部都是由广西医科大学第一附属医院放射科采集,其中肝脏CT图像是2009年6月~2011年3月期间经肝穿刺活检术确诊病例218人,肝脏MRI图像是2011年2月~2012年3月经肝脏穿刺活检术的慢性乙型肝炎患者、临床及影像典型肝硬化患者和未经肝穿刺活检术的无肝脏相关疾病病史进行上腹部MRI检查者共173例。肝纤维化分级标准按照2000年中华医学会传染病与寄生虫病学分会、肝病学分会联合修订的慢性肝炎纤维化分期标准 [12] ,分成了正常组、轻度纤维化组、重度纤维化组和肝硬化组。MRI和CT图像扫描期相分为平扫期、动脉期、静脉期和平衡期 [13] [14] 。
2.1.2.
感兴趣区域的选取
图像中提取特征信息的区域称为感兴趣区域(ROI)。ROI的选取由放射科医生完成,本研究共选取10个感兴趣区,其中在肝脏第二肝门层面取3个ROI (肝左内叶、肝右前、右后叶各选取1个);在肝脏左外叶体积最大层面取1个ROI (肝左外叶);在第一肝门层面取4个ROI (肝右前叶2个、右后叶2个);低于第一肝门层面取2个ROI (肝右前叶1个、右后叶1个)。
目前在基于医学图像处理的计算机辅助诊断肝纤维化研究当中,关于提取图像特征信息需要的ROI大小还没有一个确定的结论,因此在本次研究当中我们提取了3种尺寸大小的ROI,分别为16 × 16像素、20 × 20像素和32 × 32像素。实验中将分别采用从这三种尺寸的ROI中提取出的特征量进行分类实验,并比较它们的诊断效果,得出ROI选取的指导性结论。
2.1.3.
纹理特征提取
利用计算机辅助诊断系统中的纹理特征量提取软件Liver cirrhosis 4.8 [15] [16] 对MRI平扫及动态增强扫描、MPR重建获得的9组肝脏图像分别进行感兴趣区纹理特征量的提取。每个病人可得到9组纹理特征参数,每组参数由15个纹理特征量组成,分别为:对比度CON、角二阶矩ASM、熵ENT、相关性COR、逆差距IDM、平均灰度值MGV、差异平方和SQV、平均和SA、差异和SV、熵和SE、差方差DV、熵差DE、信息度量IMC1、信息度量IMC2、标准差SD。上述特征量值由Liver cirrhosis4.8软件自动生成一个EXCEL文件保存。
2.2. 分类诊断实验方法
本次实验采用SVM分类器作为分类诊断的核心算法,同时为了能够获得最优的诊断方案本次实验采用计算成本和时间成本最高的最优解优化算法——穷举遍历法和留一法求解优化特征量最优化选择问题。
2.2.1.
穷举遍历法
在基于医学图像的计算机辅助诊断肝纤维化研究中,医学图像的特征量优化选择是提高分类诊断准确率的重要因素。相关研究 [17] [18] [19] 在优化选择特征量的组合时都是采用次优解的特征选择算法,这些算法的实现过程比较简单快速,也是现在比较广泛使用的特征选择优化方法。但是目前学术界还存在着各种不同的次最优解的优化算法,而且各种算法无法得出一个统一的特征量最优化选择方案,目前也没有一个系统的评价体系对不同的次最优优化算法做出评估,本次研究为了保证获得最优的特征量子集,决定采用计算量最大,计算代价最高的穷举遍历法,遍历特征空间中所有的特征量组合,选取最优特征量组合子集,实现医学图像特征量的最优化选择。
假设特征量个数为n,循环遍历任意的特征量组合通过留一法获得每一个组合的分类准确率,因此N个特征量所有组合的遍历次数计算式为:
(2-1)
由式(2-1)可以看到循环遍历算法的计算复杂度为O(2n)。本次实验一共采用了15个不同的图像信息特征量,因此n = 15。每一组实验经过遍历检测时共需要进行215 − 1 = 32767次分类实验,即实验遍历的次数级别达到了104级。每一次分类实验均采用留一法通过平均统计出分类准确率。
2.2.2.
留一法
在许多研究中都是随机地确定某些样本训练和生成分类器而其余样本就作为测试样本进行测试,这种方法的最大缺点就是存在较大的随机误差,还有训练过程中存在过学习或欠学习的缺陷,导致最终的结果与事实存在较大的偏差。本文为了使我们的实验结果最接近于真实,获得最小的统计误差,提出在计算机辅助肝纤维化分期诊断研究的机器学习和分类实验中采用留一法,它是一种能够给出统计模型中具有实际泛化性能和几乎无偏估计的实验方法。
2.3. 实验流程
本次实验流程分为三大模块即数据整理输入模块、诊断实验模块和数据统计输出模块,如图1所示。数据整理输入模块包括放射科医生采用MRI扫描仪和CT扫描仪获得病人的肝脏MRI图像和CT图像,然后再由放射科医生使用我们开发的纹理特征量提取平台Liver cirrhosis 4.8 [15] [16] 。分别在肝脏MRI图像和CT图像上选取ROI。我们每选出一个ROI之后软件将计算GLCM并提取出13个特征量和2个图像基本信息特征量作为分类器的输入。数据整理输入模块最后按照肝纤维化严重程度级别将获得的特征量集合分组,分组方法按照2000年中华医学会传染病与寄生虫病学分会、肝病学分会联合修订的慢性肝炎纤维化分期标准 [12] 。
诊断实验模块分别以MRI图像和CT图像特征量集合作为输入在纤维化级别分组之间进行两两分类实验。分类实验分为3个部分进行它们分别是:ROI尺寸大小选取实验、图像特征量优化实验以及MRI图像和CT图像诊断效果比较实验。每一个部分的分类实验都采用留一法及循环遍历法,获得最接近真实情况的实验结果。诊断实验模块将每一组特征量集合的诊断准确率作为输出并输入到数据统计输出模块中。数据统计输出模块将分类实验获得的分类准确率进行统计,按照上述的3个部分统计出平均准确率和最高准确率等统计结果,然后进行比较分析得出肝纤维化辅助诊断研究3个方面的结论。
![](//html.hanspub.org/file/5-1541089x11_hanspub.png)
Figure 1. Flow chart of diagnostic classification
图1. 诊断分类实验流统计分析结果程图
以肝纤维化严重程度级别划分病人可以分为正常组、轻度纤维化组、重度纤维化组和肝硬化组。获得病人的MRI和CT图像特征量集合可以按照图像扫描期相分为平扫期、动脉期、静脉期、平衡期四个期,同时按照选取的ROI尺寸可以将提取的图像特征量集合划分为16 × 16像素组、20 × 20像素组和32 × 32像素组。MRI及CT图像特征量集合分组的每一单元内都要进行正常组、轻度纤维化组、重度纤维化组和肝硬化组之间共6组分类实验。每一组分类实验都采用循环遍历法将15个特征量的所有组合共32767种不同的特征量组合依次作为分类器的输入进行分类,分类器采用SVM分类器,分类过程中采用留一法获得15个特征量每一种组合的分类准确率,因此每一组分类实验均有32,767个分类准确率与15个特征量的各个组合对应。
本次实验的诊断实验模块采用具有强大计算能力和集成多种建模及仿真模块的MATLAB软件进行编译,本次实验的硬件环境采用Intel的Xeon E5506四核CPU,内存4GB,软件环境采用操作系统为Windows 7环境下的MATLAB2009版本。每一单元内每一组分类实验平均耗时约420分钟。
3. 实验数据统计及分析
3.1. ROI尺寸选取
针对ROI尺寸的选取研究,进行以ROI尺寸分组的分类实验,在数据统计输出模块中提取出每一单元内每一组分类实验获得的最高准确率
,计算每一单元内6组分类实验最高准确率的平均值作为该单元实验的最高平均准确率。
(3-1)
分别统计出MRI和CT图像的ROI分组和图像扫描期相分组各单元的最高平均准确率如表1所示。
(a)
(b)![](Images/Table_Tmp.jpg)
Table 1. (a) The highest average accurate rate distribution of classification experiment with MRI liver images; (b) The highest average accurate rate distribution of classification experiment with CT liver images
表1. (a) MRI肝脏图像分类实验最高平均准确率分布;(b) CT肝脏图像分类实验最高平均准确率分布
表1中每一列的平均值均表示当ROI选取某一尺寸时获得的最高准确率的平均值,MRI和CT图像在选取不同的ROI时获得的最高准确率的平均值就作为评价不同尺寸的ROI的诊断性能参数,表中可以看出不管是MRI图像还是CT图像在ROI尺寸为20 × 20像素时都能获得最优的诊断性能。由此可以知道在选取ROI尺寸为20 × 20像素时包含的特征信息已经能够为计算机辅助诊断肝纤维化程度提供足够的信息量了,通过本次实验可知ROI尺寸为20 × 20像素时诊断效果最优。
3.2. 图像特征量的优化
目前基于医学图像的肝纤维化智能诊断研究中图像特征量的最优化选取研究还处在摸索阶段,很少有文献能够明确指出基于医学图像的肝纤维化智能诊断需要选取怎样的特征量组合才能达到诊断效果最优化。
3.2.1.
图像特征量个数优化
本次研究的诊断实验模块中,实验按照ROI尺寸选取和图像扫描期相选取进行二维划分,可以划分出12个实验单元。每个实验单元都需要进行4个纤维化程度级别之间的分类实验,每个实验单元共有6组分类实验,每一组实验可以将15个图像信息特征量遍历一次。因此对于MRI图像和CT图像的特征量均需进行72组分类实验。首先针对图像特征量个数优化选取,在数据统计输出模块中将每组分类实验获得的各种特征量个数组合的最高分类准确率统计出来,记为:
,即
表示每一组分类实验的分类器只输入1个特征量时获得的最高分类准确率。分别统计出72组分类实验中各自的
值。再定义
作为评价图像特征量个数最优化选择标准,如
表示将72组分类实验中分类器只输入1个特征量时获得的最高分类准确率的平均值,其值越高表示分类器输入1个特征量时获得分类效果越好。
的计算式为:
(3-2)
根据式(3-2)可以分别计算统计出MRI和CT图像特征量个数为1至15的
值,因此得到表2。同时可以画出图像特征量个数优化选取的曲线示意图如图2所示。
![](//html.hanspub.org/file/5-1541089x22_hanspub.png)
Figure 2. The curve of the number of MRI and CT images features optimal selecting
图2. MRI和CT图像特征量个数优化选取的曲线
![](Images/Table_Tmp.jpg)
Table 2. The optimal selection of the number of MRI and CT images features
表2. MRI和CT图像的特征量个数优化选择
由图2可以看出在肝脏MRI和CT图像中选取3至7个特征量作为分类器输入时获得的诊断效果最优。如果选取的图像特征量个数过少就会造成分类器分类信息缺乏无法做出有效的肝纤维化程度级别分类,如果选取的图像特征量个数过多,也会使得分类器输入的冗余信息过多干扰分类器,因此也不能有效地诊断肝纤维化程度。
3.2.2.
图像特征量组合优化
上一小节已经得出了医学特征量个数的最优化选择的结论,本节主要是探讨图像特征量组合的优化选择。通过统计得到MRI图像特征量分类实验结果的总体均值
,总体标准差
,CT图像特征量分类实验结果总体均值
,总体标准差
,然后分别对MRI和CT图像特征量所有分类实验结果进行Kolmogorov-Smirnov检验 [20] ,得MRI和CT图像特征量所有分类实验结果均近似服从正态分布,记为:
,如图3所示。
由于MRI和CT图像特征量组合分类实验结果的总体数量均级达到106,为了有效获得评价每个图像特征量对分类实验准确率的权重,对整个分类实验结果做分析是不可能实现的。因此在数据统计输出模块中我们对需要分析的特征量组合要进行筛选,再从这些特定的特征量组合中通过成分权重分析 [21] ,确定哪些特征量对分类实验的准确率具有较大的贡献度。
首先需要设定筛选特征量组合的条件,根据图2所示,我们认为分类准确率为总体分类准确率前10%的特征量组合具有显著的分类性能,因此组成这些组合的特征量对分类准确率的提高具有比较大的权重。根据正态分布概率密度公式:
(3-3)
设定
求得MRI图像特征量组合的筛选阈值
,同理求得CT图像特征量组合的筛选阈值
。设
、
分别表示需要筛选出的MRI图像和CT图像特征量组合的分类实验准确率,它们满足如下条件式:
(3-4)
根据式(3-4)筛选出特定的特征量组合后再通过成分权重分析计算15个特征量对肝纤维化程度分类实验的权重值。为了表征特征量的权重值我们定义一个取值范围为[0, 1]的变量C表示特征量权重值,例如
表示ASM的权重值,若
表示15个特征量中权重值最小,对应的
则表示权重值最大。成分权重分析的计算过程是将满足条件式(3-3)的特征量组合同时包含有某个特征量的分类实验准确率进行累加,获得的准确率累加值再做15个特征量的归一化处理就获得该特征量的权重值。例如对MRI图像特征量ASM的权重值
的计算表达式为
(3-5)
![](//html.hanspub.org/file/5-1541089x41_hanspub.png)
Figure 3. The distribution of classification accurate rate of MRI and CT images features
图3. MRI和CT图像特征量分类准确率分布
同理在计算CT图像的ASM权重值时计算公式为
(3-6)
参照式(3-5)和(3-6)分别计算出本次实验研究的15个特征量的权重值,如表3所示。
为了能够直观地表示图像特征量的权重值分布,由表3可以分别画出MRI肝脏图像和CT肝脏图像特征量的权重分布图,如图4和图5所示。根据表3分别统计出MRI图像和CT图像提取出来的特征量权重值排名前七位如表4所示。根据表3可以知道MRI图像和CT图像权重值都比较大的特征量的特征量对于肝纤维化程度的敏感性均比较高,能够比较准确地反映出肝脏组织纤维化的病理过程。其中平均灰度值逆差分钜和熵这三个图像特征量在肝脏MRI图像和CT图像中都具有比较大的权重值,说明不管是采用MRI扫描还是CT扫描获得的肝脏图像都会因为肝纤维化程度的不同使得图像的整体亮度发生改变。同时也说明了图像亮度参量对于计算机智能诊断肝纤维化程度具有比较大的影响,当图像中整体亮度提高时图像纹理也相应的更加清晰,能够更准确地将肝脏纤维组织纹理信息反映出来。在图像纹理中逆差分钜表示图像纹理的同质性即度量图像中纹理的局部变化量,熵表示图像中纹理的信息度量和杂乱程度。这两个特征量在针对肝纤维化程度的纹理分析具有普遍的意义。
从图4和图5中我们还可以看到15个图像特征量中,相关性的权重值都为0,说明在这两种肝脏医学图像中的纹理相关性很低,图像纹理的分布没有相关性。在MRI图像中共生和方差的权重值也比较低而共生和均值的权重值比较高说明在肝脏MRI图像中局部区域纹理的变化并不明显,但是局部区域纹理的整体灰度值比较高。而CT图像中的共生和均值和共生和方差都比较低则说明肝脏CT图像中局部区域的纹理信息都不能明显表征肝纤维组织。另外肝脏MRI图像和CT图像的信息度量2的权重值也都比较低则说明在这两种图像中肝纤维化变化造成的纹理能量强度分布并不明显。本次实验中获得的肝脏MRI图像和CT图像特征量优化组合的指导性结论分别由表4(a)和表4(b)列出。
![](//html.hanspub.org/file/5-1541089x44_hanspub.png)
Figure 4. The distribution curve of MRI images features
图4. MRI图像特征量权重值分布曲线
![](//html.hanspub.org/file/5-1541089x45_hanspub.png)
Figure 5. The distribution curve of CT images features
图5. CT特征量权重值分布曲线
(a)
(b)![](Images/Table_Tmp.jpg)
Table 3. (a) Weight value of MRI and CT images features (1); (b) Weight value of MRI and CT images features (2)
表3. (a) MRI和CT图像特征量权重值(1);(b) MRI和CT图像特征量权重值(2)
(a)
(b)![](Images/Table_Tmp.jpg)
Table 4. (a) The ranking of MRI liver images features weight value; (b) The ranking of CT liver images features weight value
表4. (a) MRI肝脏图像特征量权重值排名;(b) CT肝脏图像特征量权重值排名
3.3. MRI和CT图像的诊断实验比较
根据表1,可以明显的发现MRI图像的分类准确率均比CT图像的分类准确率高。根据图2图像特征量个数优化选取的曲线可以看到MRI图像特征量个数优化选取曲线整体位于CT图像特征量个数优化选取曲线的上方。根据图3所示,MRI和CT图像特征量分类结果分布曲线可以知道,MRI图像特征量分类实验结果分布明显优于CT图像特征量分类结果。因此可以得到结论相比于CT图像,MRI图像对于肝纤维化程度变化具有更高的灵敏性,在进行肝纤维化计算机辅助诊断中选择肝脏MRI图像要优于肝脏CT图像。
根据
3.2.2
小节MRI图像和CT图像特征量组合最优化结论中,发现MRI图像特征量优化组合的集中度要高于CT图像特征量组合的集中度。分别计算MRI图像和CT图像15个特征量权重值的平均值
、和标准差
(3-7)
(3-8)
得到MRI图像和CT图像15个特征量权重值的标准差分别为
、
,比较这两个标准差值得
。从统计学意义上可以得到MRI图像特征量权重值大的特征量比较集中,对应地CT图像的特征量权重值比较平均。可以推断出MRI特征量组合的优化程度要高于CT图像特征量组合的优化程度。
4. 结论
本次研究主要阐述了基于MRI图像和CT图像的分类诊断实验方法,实验过程和分析了分类诊断实验的结果。本次分类诊断实验采用了最能保证实验结果真实性的穷举遍历法和留一法,分别对ROI尺寸的优化选取及肝脏扫描期相的优化选取、图像特征量个数优化选取和特征量组合优化选取,进行肝纤维化程度分级的分类实验。实验结果表明采用ROI尺寸为20 × 20像素时都能获得最优的诊断性能;图像特征量个数选择中选取3至7个特征量作为分类器输入时获得的诊断效果最优;获得了MRI和CT图像15个特征量权重值的分布;比较MRI图像和CT图像的整体分类诊断实验结果得到肝脏MRI图像的诊断性能要优于CT图像。
致谢
本研究室的曾宇凡,黄裕锟,梁田,石家雄等多位同学完成了很多先期工作;匿名审稿老师对本文提出了宝贵的修改意见,在此表示感谢!
基金项目
本课题得到广西自然科学基金“形状纹理特征量的提取及其优化研究”(No. 2017JJA170765y);国家自然基金“计算解剖学在腹部疾病诊断及手术中的应用研究”(No. 81460274)和“基于CT数据的胃癌模型的三维重建和手术仿真”(No. 81760324)资助。
NOTES
*通讯作者。