基于改进神经网络的肺炎图像分类研究
Research on Pneumonia Image Classification Based on Improved Neural Network
DOI: 10.12677/MOS.2024.132129, PDF, HTML, XML, 下载: 130  浏览: 231 
作者: 曾德洋, 杨鑫荣:上海理工大学光电信息与计算机工程学院,上海
关键词: 肺部X图像DenseNet121金字塔池化X-Ray Images of the lungs DenseNet121 Pyramid Pooling
摘要: 早期的发现和诊断对于治疗新冠患者至关重要,利用卷积神经网络识别肺部X光图像判别新冠患病与否,在实际医疗中得到了广泛应用。基于卷积神经网络的方法能够迅速、准确地判别肺部X光图像。然而,传统的卷积神经网络模型在处理图像数据时存在一定的不足,特别是在特征提取方面缺乏针对性。为此,本文提出了一种融合金字塔池化模型(PPM)的神经网络模型。本文将DenseNet121模型与PPM特征提取模块进行了巧妙的融合,并通过在肺炎公开数据集上进行验证,展示了该方法在实际应用中的有效性。实验结果表明,本文提出的融合金字塔池化模型的网络架构显著提升了对新冠肺炎的识别准确性。这一创新性的图像识别方法不仅在实践中取得了显著的效果,而且为深度学习在医学影像领域的应用提供了有益的参考。这对于改善COVID-19早期诊断和治疗具有积极的推动作用,对于未来类似疾病的防控和医学研究也具有一定的指导意义。
Abstract: Early detection and diagnosis are crucial for the treatment of COVID-19 patients. The use of convo-lutional neural networks to identify lung X-ray images and determine whether a person is infected with COVID-19 has been widely applied in practical medical settings. Methods based on convolu-tional neural networks can rapidly and accurately discern lung X-ray images. However, traditional convolutional neural network models have certain limitations when processing image data, partic-ularly in the lack of specificity in feature extraction. To address this issue, this paper proposes a neural network model that integrates a Pyramid Pooling Module (PPM). The paper ingeniously combines the DenseNet121 model with the PPM feature extraction module. Through validation on a public dataset of pneumonia cases, the effectiveness of this method in practical applications is demonstrated. Experimental results show that the network architecture of the proposed integrated Pyramid Pooling Model significantly improves the accuracy of identifying COVID- 19 pneumonia. This innovative image recognition method not only achieves remarkable results in practice but also provides valuable references for the application of deep learning in the field of medical imaging. It plays a positive role in advancing the early diagnosis and treatment of COVID- 19, and it has signifi-cant implications for the prevention and medical research of similar diseases in the future.
文章引用:曾德洋, 杨鑫荣. 基于改进神经网络的肺炎图像分类研究[J]. 建模与仿真, 2024, 13(2): 1374-1380. https://doi.org/10.12677/MOS.2024.132129

1. 引言

大量研究证明,采用深度学习对肺部X光图像进行检测相比人工肉眼检测具有更高的准确性,并能在更短的时间内完成检测。Shannar Phne [1] ,利用ResNet网络对肺炎图像进行分类鉴别,在平衡数据集上分类准确度达到94%,在不平衡数据集上分类准确度达到86%。Bilda [2] 等提出了一种XrayChestNet_v1模型用于肺炎图像的检测。Been [3] 等论证了VGG16在肺炎分类任务上要优于Xception。Jiaqi Zhang [4] 等论证了EfficientNet在多肺炎分类上要优于ResNet以及VGG模型。Siyang Li [5] 等利用改进的ResNet模型进行肺炎分类,最大分类准确度达到96%,F-Score达到93.4%。Somaiya Khan [6] 等提出了CPNet模型,该模型在肺炎二分类数据集上的准确度达到99.15%,召回率达到98.44%,精确度达到99.06%,F-Score达到99.02%。Tarssya [7] 等将ResNet50、VGG16、InceptionV3进行融合,该融合模型在三分类肺炎数据集上的准确度达到97.52%,特异性达到96.12%。Sanchit [8] 等将CNN与GAN进行融合,在多分类肺炎数据集上的分类准确度达到99%。裴颂文 [9] 等人提出了一种全新的图像降噪的生成对抗网络模型(TriGAN),对医学图像进行降噪处理,同时增强图像特征,TriGAN与DnCNN以及GAN相比,图像峰值信噪比平均提高4.5%,结构相似性平均提高1.5%。周天奕 [10] 等,提出了一种基于模糊逻辑引导的多粒度深度神经网络,该网络对病理图像特征信息的提取具有较高敏感度,该模型在组织病理图像分类上具有较高的准确率。Chakshu [11] 等利用Grad-CAM对VGG16模型进行模型增强,增强后的模型相较于原始VGG16在医学图像分类上的准确度得到了较大的提升。Yangqin [12] 等提出了一种Deep Supervised Domain Adaptation (DSDA)模型用于肺炎图像的检测分类,并取得了良好的结果。

上述方法的实验涉及的肺部X光图像在肺炎分类检测任务中得到了广泛应用。然而,由于肺部X光图像数据集存在较大的类别不平衡性,导致了分类结果与实际情况之间存在一定的偏差。这种不平衡性可能导致模型在预测中更偏向于具有更多样本的类别,而对于较少样本的类别的分类性能相对较低。

2. 方法

本文构建的肺炎图像分类模型如图1所示,由三部分组成,分别为:DenseNet201模块、PPM特征模块、全连接分类层三个部分组成。

Figure 1. DenseNet121 model network structure integrating PPM

图1. 融合PPM的DenseNet121模型网络结构

DeneNet121模型

DenseNet121属于密集连接卷积神经网络(Dense Convolutional Network)的一种变体。DenseNet121的最显著特点是其密集连接的结构。在传统的卷积神经网络(CNN)中,通过逐层连接,每一层的输出只与前一层的输出相连接。而在DenseNet121中,每一层的输出都与之前所有层的输出直接相连,形成密集的连接。这种密集连接使得信息能够更加充分地传递和共享,有效缓解了梯度消失问题,提高了梯度的传播效率。尽管DenseNet121拥有较深的网络结构,但由于其密集连接的设计,相比传统的深层网络,它需要更少的参数。这带来了两方面的优势:首先,参数共享和信息传递的高效性有助于减小过拟合的风险;其次,更少的参数使得DenseNet121在相同计算资源下更容易训练和优化。DenseNet121主体结构由密集块(Dense Block)和过渡块(Transition Block)交替堆叠而成。密集块由多个卷积层组成,每个卷积层后面都有一个密集连接,将前面所有层的输出作为输入。过渡块则包含卷积层和池化层,用于减小特征图的大小,控制模型的复杂度,并引入新的特征。DenseNet121最后一层为全局平均池化层,将整个特征图转化为一个固定大小的向量。这种全局池化的设计有助于减少模型的参数数量,提高模型的泛化能力,同时在处理不同大小的输入图像时保持不变性(图2)。

Figure 2. DenseNet121 model structure diagram

图2. DenseNet121模型结构图

3. 实验

3.1. 肺炎数据集及预处理

为了验证本文提出的融合金字塔池化模型的DenseNet121在2分类肺炎领域的有效性和可行性,我们使用了如图3所示的数据集,本文使用了Kaggle公开肺炎数据集。该数据集由10,192张正常肺炎CT图像以及3612张新冠肺炎图像构成,由于实验数据集样本的不平衡性,可能会对模型性能造成一定的影响,因此本文采用迁移学习来对模型进行预训练,随后将肺炎数据集输入到模型中进行训练,以此达到提高模型性能的目的。本文所用数据集如图3所示。

(a) 正常肺部图像(b) 新冠肺炎图像

Figure 3. Pneumonia dataset

图3. 肺炎数据集

为确保实验的科学有效性以及模型的健壮性,本实验预先将两种数据集按8:1:1的比例随机分配到训练集、测试集及验证集中(表1)。

Table 1. Dataset partitioning

表1. 数据集划分情况

3.2. 模型评价指标

为了多方位多角度的评估本实验模型真实性能,本文采引入了3中不同评估指标,分别为准确性、敏感性和精确度,准确性表示在所有样本分类中正确分类的比例,敏感性表示在所有实际正类别样本中成功预测为正类别的比例,精确度表示在所有被预测为正类别的样本中,真实属于正类别的比列,各评价指标公式如下所示。

Accuracy = (TP + TN)/(TP + FP + TN + FN) (1)

Sensitivity = TP/(TP + FN) (2)

Precision = TP/(TP + FP) (3)

True Positive(TP)表示模型正确预测为正类别的样本数量,True Negative (TN)表示模型正确预测为负类别的样本数量,False Positive (FP)表示模型错误地将负类别样本预测为正类别的数量,而False Negative (FN)则表示模型错误地将正类别样本预测为负类别的数量。

3.3. 实验结果

本文使用ImageNet公开数据集进行模型的预训练,使得模型具有一个较为合理初始参数,大量实验证明即便使用与目标数据集相差较远的数据集进行模型预训练,也要比不进行模型预训练的模型具有更好的性能。本实验中我们使用Swish作为激活函数,Swish激活函数是一种光滑、非单调的激活函数,其特点在于相较于ReLU,它在模型训练中引入了一定的非线性,Swish保留了ReLU的简单性和计算效率,同时引入了更平滑的梯度,有助于缓解梯度消失问题。本实验使用SGD作为优化器,其特点是通过随机选择小批量样本进行梯度计算和参数更新。SGD具有较低的计算成本、能够处理大规模数据集的特点。

Swish(x) = x * Sigmod(x) (3)

其中X代表输入特征,Sigmod为激活函数。

为证明金字池化模块可以提升模型对COVID-19的准确性、敏感性、精确度,本文对单一DenseNet121模型以及融合了金字塔池化模型的DenseNet121模型在二分类肺炎数据集上进行了实验,训练中所有的配置、学习率、训练次数都保持一致。实验结果如表2表3所示。

从实验结果表2表3可以明显观察到,引入金字塔池化模块后,模型在准确率、敏感度和精确度等评价指标上均呈现出显著的提升。从图相较于单一的DenseNet121模型,融合了金字塔池化模块的改进模型在准确度、敏感性和精确度上分别提高了1.1%、0.27%和0.89%。这一实验证明了金字塔池化模块的引入对模型性能具有积极的影响,特别是在对COVID-19阳性样本的识别方面,取得了显著的进展。

Table 2. DenseNet121 model results

表2. DenseNet121模型结果

Table 3. Results of DenseNet121 model integrating pyramid pooling module

表3. 融合金字塔池化模块的DenseNet121模型结果

图4可以看出,基于PPM的DenseNet121分类模型几乎在每一个Epoch上的Accuracy都高于单一DenseNet121模型,且在训练过程中基于PPM的DenseNet121分类模型具有较为平和的收敛曲线,而单一DenseNet121模型在训练初期震荡较为明显。

Figure 4. Comparison of classification accuracy between fusion model and single DenseNet121 model

图4. 融合模型与单一DenseNet121模型分类准确度对比

图5可以看出,基于PPM的DenseNet121分类模型在模型分类的敏感度上要明显优于单一DenseNet121模型

Figure 5. Comparison of classification sensitivity between fusion model and single DenseNet121 model

图5. 融合模型与单一DenseNet121模型分类敏感性对比

图6可以看出,基于PPM的DenseNet121分类模型与单一DenseNet121模型在分类精确度上差别明显,相较于单一DenseNet121模型,基于PPM的DenseNet121模型精确度的收敛速度更快,且震动更小,体现出了模型性能的稳定性。

Figure 6. Comparison of classification precision between fusion model and single DenseNet121 model

图6. 融合模型与单一DenseNet121模型分类精确度对比

金字塔池化模块的融合使得模型能够更好地捕获多尺度的特征,提高了对图像内部微小结构和全局信息的感知能力。这对于医学图像中病变的复杂和多样性具有重要意义。因此,通过增加金字塔池化模块,模型更全面地理解了图像特征,进一步优化了对COVID-19阳性样本的准确识别,为临床诊断提供了更可靠的支持。

4. 结束语

为解决新冠肺炎的快速筛查,本文提出了一种创新的图像识别网络模型,采用了融合金字塔池化模块的策略。通过引入金字塔池化模块,该模型能够更充分地提取图像特征,从而提高对新冠肺炎的准确性。实验中,我们对比了单一的DenseNet121模型和融合金字塔池化模块后的模型,结果显示融合模型在新冠肺炎识别方面取得了显著的性能提升。相较于单一DenseNet121模型,融合金字塔池化模块的复合模型在肺炎分类的Accuracy、sensitivity、Precision上分别提升高了1.1%、0.27%和0.89%。这项研究的贡献在于提供了一种有效的方法,通过融合金字塔池化模块来增强图像识别网络,为提高新冠肺炎图像分类的准确性提供了新的思路。

参考文献

[1] Phine, S. (2023) Pneumonia Classification Using Deep Learning VGG19 Model. 2023 IEEE Conference on Computer Applications (ICCA), Yangon, 27-28 February 2023, 67-71.
https://doi.org/10.1109/ICCA51723.2023.10181954
[2] Montalico, B. and Herrera, J.C. (2022) Classification and Detection of Pneumonia in X-Ray Images Using Deep Learning Techniques. 2022 IEEE Sixth Ecuador Technical Chap-ters Meeting (ETCM), Quito, 11-14 October 2022, 1-5.
https://doi.org/10.1109/ETCM56276.2022.9935757
[3] Godbin, A.B., Revathi, M., Bushra, S.N. and Sibi, S.A. (2022) An Efficient AI Model for Identification and Classification of Pneumonia from Chest x-Ray Images. 2022 Inter-national Conference on Innovative Computing, Intelligent Communication and Smart Electrical Systems (ICSES), Chen-nai, India, 15-16 July 2022, 1-7.
https://doi.org/10.1109/ICSES55317.2022.9914292
[4] Zhang, J., Chng, C., et al. (2020) Detection and Classifi-cation of Pneumonia from Lung Ultrasound Images. 2020 5th International Conference on Communication, Image and Signal Processing (CCISP), Chengdu, 13-15 November 2020, 294-298.
https://doi.org/10.1109/CCISP51026.2020.9273469
[5] Li, S., Liu, J., Du, C.J. and Wang, L. (2023) Pneumonia Image Classification Based on ResNet Model and Its Optimization. 2023 8th International Conference on Intelligent Computing and Signal Processing (ICSP), Xi’an, 21-23 April 2023, 1598-1603.
https://doi.org/10.1109/ICSP58490.2023.10248660
[6] Khan, S., Khan, A. and Khan, A. (2023) CPNet: Covid19 and Viral Pneumonia Automated Detection Based on Convolutional Neural Network. 2023 5th International Conference on Robotics and Computer Vision (ICRCV), Nanjing, 15-17 September 2023, 23-27.
https://doi.org/10.1109/ICRCV59470.2023.10329045
[7] Saputra, T.B., Pasaribu, N.T.B., Gany, A., Hasugian, J. and Sartika, E.M. (2022) Multiclass Classification of COVID-19, Pneumonia, or Nornal Lungs Based on Chest X-Ray Images with Ensemble Deep Learning. 2022 FORTEI-International Conference on Electrical Engineering (FORTEI-ICEE), Riau, 11-12 October 2022, 76-80.
https://doi.org/10.1109/FORTEI-ICEE57243.2022.9972884
[8] Vashisht, S., Lamba, S., Sharma, B. and Sharma, A. (2023) Pneumonia Detection and Classification with CNN-GAN Augmentation Using Fine Tuning. 2023 Interna-tional Conference on Innovations in Engineering and Technology (ICIET), Muvattupuzha, 13-14 July 2023, 1-5.
https://doi.org/10.1109/ICIET57285.2023.10220713
[9] 裴颂文, 樊静, 沈天马, 顾春华. 面向低剂量CT图像的多生成器对抗网络降噪模型的研究[J]. 小型微型计算机系统, 2020, 41(12): 2582-2587.
[10] 周天奕, 丁卫平, 黄嘉爽, 鞠恒荣, 姜舒, 王海鹏. 模糊逻辑引导的多粒度深度神经网络[J]. 模式识别与人工智能, 2023, 36(9): 778-792.
[11] Grover, C., Vats, S., Sharma, V., Rawat, P., Bajaj, M. and Singh, S. (2023) Intelligent System for Identi-fication and Classification of Pneumonia using Machine Learning. 2023 3rd Asian Conference on Innovation in Tech-nology (ASIANCON), Ravet IN, 25-27 August 2023, 1-6.
https://doi.org/10.1109/ASIANCON58793.2023.10269870
[12] Feng, Y., Xu, X., et al. (2022) Deep Supervised Domain Adaptation for Pneumonia Diagnosis From Chest X-Ray Images. IEEE Journal of Biomedical and Health In-formatics, 26, 1080-1090.
https://doi.org/10.1109/JBHI.2021.3100119