神经网络算法于消渴内障的应用的研究进展
Research Progress on the Application of Neural Network Algorithms in XiaokeNeizhang
DOI: 10.12677/hjo.2024.132004, PDF, HTML, XML, 下载: 48  浏览: 84 
作者: 孙健豪:成都中医药大学临床医学院,四川 成都;郑燕林*:成都中医药大学附属医院眼科,四川 成都
关键词: 消渴内障深度学习神经网络糖尿病性视网膜病变XiaokeNeizhang Deep Learning Neural Network Diabetic Retinopathy
摘要: 消渴内障大致相当于西医学的糖尿病性视网膜病变,为消渴病的常见并发症之一,对患者的视力损失及生活质量造成了较大的影响。除了消渴病本身的原发病因素,消渴内障自身的复杂性与难治性也为患者造成了庞大的医疗负担。因此,对于消渴内障的早筛查、早干预成为了防治的第一阵地。近年来,随着光学技术的发展与应用技术的成熟,眼底的情况从以前的“不可知”到现在的“可知”,极大地帮助了对于该疾病的早期筛查及诊断分期。而神经网络算法的加入,使得对于该病的诊断技术达到了“超前预测”的水平。但对于祖国医学而言,消渴内障的辨证尚未完全搭上这班“神经网络算法”的快车。因此,本文拟对近年来神经网络算法于消渴内障病应用的研究进展做系统综述,以启迪其在中医辨证论治的应用,丰富中医望诊的内容,以求得“治未病”之功。
Abstract: Abstract: XiaokeNeizhang is roughly equivalent to diabetic retinopathy in Western medicine. It is one of the common complications of diabetes and has a great impact on patients' vision loss and quality of life. In addition to the primary causative factors of diabetes, the complexity and refractory of XiaokeNeizhang also impose a huge medical cost on patients. Therefore, early screening and early intervention for XiaokeNeizhang have become the first line of prevention and treatment. In recent years, with the development of optical technology and the maturity of application technology, the condition of the fundus has changed from “unknowable” to “knowable” now, which has greatly helped the early screening and diagnosis and staging of the disease. The addition of neural network algorithms has enabled the diagnosis technology of this disease to reach the level of “prediction”. But for Traditional Chinese Medicine, the syndrome differentiation of XiaokeNeizhang has not yet completely caught up with the express train of this “neural network algorithm”. Therefore, this article intends to conduct a systematic review of the research progress of neural network algorithms in the application of XiaokeNeizhang in recent years, in order to enlighten its application in syndrome differentiation and treatment of Traditional Chinese Medicine, enrich the content of Traditional Chinese Medicine examination, and achieve the effect of “preventing disease”.
文章引用:孙健豪, 郑燕林. 神经网络算法于消渴内障的应用的研究进展[J]. 眼科学, 2024, 13(2): 20-26. https://doi.org/10.12677/hjo.2024.132004

1. 研究背景

消渴内障,因消渴而导致的视衣受损、神光自内而闭的内障疾病。消渴病总因“阴虚为本、燥热为标”属于慢性消耗性疾病[1],其病机在于饮食、情志及素体虚弱所导致的阴液亏虚而内生燥热所致的脏腑虚弱的系列疾病,重点责之肺脾肾三脏,而分上中下三焦。如《秘传证治要诀》中认为“三消日久,精血既亏,或目无视,或受阻偏废如风疾”,可知其能导致许多并发症,而视衣属广义瞳神范畴,归肾所主,而阴虚所伤至目视不明。消渴内障作为消渴病严重并发症之一,其大致范围相当于西医的糖尿病性视网膜病变。该病使患者身体承担长期的病痛,治疗时间比较长给贫穷家庭增加经济负担[2],另外,糖尿病视网膜病变给身体带来的伤害是不可逆的,无法根治的[3],严重者发展至增殖期可产生新生血管,牵拉视网膜致盲[4]。据流行病学调查,中国糖尿病患者已达近1.4亿,居全球第一[5]。在其中又有23%的糖尿病视网膜病变患者[4]。在全球范围内,大多数糖尿病患者致盲原因都是由于糖尿病视网膜病变引起的[6] [7]。因此尽可能在早期诊断该病并对其进行干预对致盲的防治显得尤为重要[6]

神经网络算法在眼科中的主要好处可能在于筛查,例如糖尿病性视网膜病变,对此已有临床的应用[8] [9]。然而,无论是发达国家还是中低收入国家,筛查都需要医疗系统投入大量的人力和财力。深度学习的使用与远程医疗相结合,是为节省基层眼科医生不足及水平不平衡矛盾的长期解决方案。本综述总结了用于消渴内障方面,即糖尿病性视网膜病变应用的神经网络算法系统、临床实践中的应用。

2. 研究现状

2.1. 理论方面

机器学习在1959年提出,其通过系统从经验中自动学习,从大数据中总结经验归纳并完成任务的模型,这就像模仿人类的学习行为一样[10]。在19世纪80年代,机器学习在计算机预测分析中展现了巨大潜力。深度学习是机器学习的分支领域,可以使用类似于人脑的神经网络研究来自多个处理层的数据潜在特征,在信息技术领域迎来了新的突破。目前,深度学习在医学上取得了广泛的突破和应用,尤其是在疾病的诊疗及药物开发[18] [19]。目前医学上应用的深度学习主要包括长短期记忆网络[11] (Long Short-Term Memory, LSTM)、受限波曼机[12] (Restricted Boltzmann Machine, RBM)和卷积神经网络[13] ( convolutional neural network CNN)等。其中,医学图像识别领域最常用的深度学习方法便是卷积神经网络。卷积神经网络是一种点到点的学习,其主要有输入层、卷积层、池化层、激活函数、全连接层以及输出层组成。它的算法构架由最初层数较少较为简单到如今深度的提高发展大致可分为LeNet [14]、AlexNet [15]、VGGNet [16]、GoogleNet [17]和ResNet [18]和Inception [19]等。卷积神经网络的应用一方面可以发现研究对象细微的特征从而提高检出率和准确度;另一方面,亦可降低对人工的依赖,大大减少成本开销。

2.2. 实践方面

具体来说,眼科疾病的传统诊断方法取决于临床评估,并且越来越依赖于各种模式的图像捕获设备。这个过程既耗时又昂贵,但也使眼科成为特别适合神经网络技术及其实际应用的专业之一。据报道,将神经网络算法应用于眼底照片可实现对常见威胁视力疾病的自动筛查和准确诊断,其中包括糖尿病视网膜病变(DR) [20]。同样OCT的图像同样适用于神经网络算法进行学习,用以诊断各种原因引起的黄斑水肿[21],如DR、AMD等。美国的IDx-DR [22]可以自动诊断糖尿病视网膜病变而免于医生的报告解读。我国自主研发的“嵩岳机器人”亦可提高DR的早期微小病灶筛查率,以促及时干预治疗[23]

3. 研究方法学上的进展

对于消渴内障,无论是中医或西医的诊断,均需参照眼底表现,除裂隙灯下直接检查眼底,最直观的就是拍摄留下眼底照片供长期参考。那么根据眼底照片对该病进行自动化诊断分级再到中医辨证的参考。大致可以通过神经网络算法进行如下步骤处理完成。

3.1. 数据的预处理

眼底照片多有眼底照相机分别采集双眼眼底信息而成像,但是根据机型和设置参数的不同,同一个人的同一侧眼的眼底情况显像也不尽相同。如德国蔡司的CLARUS 500眼底照相机色彩更贴近真实色彩,而采用红绿激光双通道扫描的英国欧堡眼底照相机的色彩更加绚丽。此外图片的分辨率和格式不同亦是不同来源数据的常见问题。因此,对于来源不同的大样本数据的深度学习,为减少系统误差,其同质化处理显得尤为重要。其要点大致分为两点,其一是格式尺寸的统一;其二是图片的增强,目的是为了能突出差异,便于提取病灶信息,从而根据疾病的特征化表现完成识别和学习。

基于糖尿病性视网膜病变的眼底表现,最重要的是完成特征化表现的识别,这就要通过图像增强技术对眼底照片的处理来完成。而图像的增强实现,主要基于空域与频域两种。

3.1.1. 空域算法

空域算法主要是对照片的像素点进行操作,其基本表达式为:

f( X,Y )=F( X,Y )i( X,Y )

其中,F (X, Y)为原图像,i (X, Y)为变换函数,f (X, Y)为输出后的图像。根据运算的不同,分为点运算和局部运算。详细关系见图1

Figure 1. Components of spatial domain

1. 空域算法的组成关系

3.1.2. 频域算法

频域法主要对图片的频率组合进行操作,通过傅里叶变换改变图像中的部分频率的分量组合,而不影响其他部分来达到重组频率分布从而输出处理后图片,即从图片到频域再到图片的变换,来达到增强的效果。方法上,大致分为低通滤波和高通滤波。前者主要为达到平滑图像目的,后者主要为达到去除低频分量保留高频分量从而达到锐化的目的。

3.2. 特征性指标的提取

当下主流的特征提取模型是DeepLab [24],其主要基于Atrous convolution,优点主要在于能够满足DR检测对图像清晰度、细节特征定位的精细要求,以便更好达到早筛查的准确效果。目前已经发展到DeepLab V3+,其优点在于较前代,提升了速度和稳健性。

3.3. 数据分类的处理

GooLeNet模型[25]由谷歌开发,由22层深度网络组成,运用了Inception网络模块完成了多层次的卷积层和池化层运算,大大减小了计算参数,提高了计算效率。当下许多影像学相关的图像分析与分类都应用了该模块。在DR方面,GooLeNet的检测识别准确性可达到89.43% [26]

ResNet模型通过残差结构来解决网络层数过深带来的梯度消失或梯度爆炸问题,同时不需要增加额外的分类来保留梯度信息,所以常常用来处理很深的网络结构[27] [28]。因此,在DR检测方面同样能处理许多精细的结构,提高整体模型的稳定型。

NasNet模型由谷歌开发,是一种自动化设计的深度学习模型。它能通过搜索和优化可能的神经网络,从中选取最优的解。因此,在面对庞大而又繁杂的特征DR信息,显示出了优秀的表现[28]。但是由于计算量的庞大,其训练过程较为耗时,因此不太适合计算资源有限的环境。为此谷歌团队开发了NasNet-Mobile来供该环境使用。

4. 消渴内障的眼底辨证与神经网络算法

中医药辨证论治在消渴病及其并发症中,内容十分丰富。目前基于望闻问切,四诊合参的辨证体系中,舌象[29] [30]和脉象[31]的算法开垦较多,但在利用眼底辨证的方面攻关开垦较少。眼底作为人体可直接窥探到微循环的部位,同样属于中医望诊的范畴,对于全身性疾病的诊断和治疗作用同样不容小觑,而消渴内障病恰恰需要结合眼底情况进行辨证,为结合神经网络算法进行深度学习进行归纳提供了坚实的理论基础。同时消渴病本身对全身的微血管损害能通过眼底情况的表现为多学科协作诊疗(MDT)提供参考。

5. 总结与启示

本文总结了基于神经网络算法的糖尿病视网膜病变(DR)诊断,当下已经成为医学影像分析领域深度学习诊断精度高的一项AI技术。在理论上,DR诊断的敏感性不断提升,可基本达到临床设想;在实践上,相关产业技术也已落地,并不断提高。而现阶段,更高维度,更迅速的诊断需求讲促使多平台、多来源的交叉合作。因此,采取特有数据集的单一资料来源,在不同平台的预测验证准确度尚不足。同时,在深度学习领域,要始终保持人必须能够解释算法如何做出决定,即一切为人的导向。

在疾病特征检测方面, 比如文中的DR,其原发病为糖尿病,并非单纯的眼科疾病,所以如何实现从检测单一病种到支持多种病种综合预测。而因为各种病种的诊断支持证据不同,使得算法本身无法满足全部的要求, 因此值得学界进一步探索。同时在DR早期,眼底检测可能并不能发现视网膜病变,而视网膜电图的成分振荡电位(Ops)由于可客观敏锐反应出视网膜内层的循环[32],故可观测到特征性改变。但相较于眼底图片资料,仍然开垦程度不够,同样值得在早期诊断上进一步探索。

中医方面,如何搭上神经网络的“快车”?对于DR,冰冻三尺非一日之寒,祖国医学认为久病入络,久病必瘀,久病必虚。如何从眼底望诊的角度从微观来理解消渴病导致的瘀和虚,通过深度学习来丰富望诊的内容,辅助辨证,进而更深层次的理解方药的治疗。此亦是中医面向现代化发展的机遇值得广泛研究。未来不仅仅应用于诊断,还可面向技术创新和研发帮助医生制定个性化的治疗方案,根据患者的病情特征和临床表现,为其量身定制最合适的治疗方案。通过分析患者的眼底图像和其他临床数据,深度学习模型可以预测病情的发展趋势和治疗效果,为医生提供科学依据和决策支持,从而实现个性化治疗,最大程度地减少患者的痛苦和并发症的发生。

本文旨在为医工交叉领域的研究者与产业界专家提供一定借鉴与参考为中医现代化发展提供现代技术交融思路。

NOTES

*通讯作者。

参考文献

[1] 周丹, 刘利哲, 张桐楠. 基于“开导之后宜补论”治疗消渴内障的经验探析[J]. 中国中医眼科杂志, 2016, 26(1): 61-63.
[2] 单祎. 糖尿病性视网膜病变的视力损伤负担及其危险因素分析[D]: [博士学位论文]. 杭州: 浙江大学, 2021.
[3] Yau, J.W.Y., Rogers, S.L., Kawasaki, R., Lamoureux, E.L., Kowalski, J.W., Bek, T., Chen, S.-J., Dekker, J.M., Fletcher, A., Grauslund, J., Haffner, S., Hamman, R.F., Ikram, M.K., Kayama, T., Klein, B.E.K., Klein, R., Krishnaiah, S., Mayurasakorn, K., O’Hare, J.P., Orchard, T.J., Porta, M., Rema, M., Roy, M.S., Sharma, T., Shaw, J., Taylor, H., Tielsch, J.M., Varma, R., Wang, J.J., Wang, N., West, S., Xu, L., Yasuda, M., Zhang, X., Mitchell, P. and Wong, T.Y. (2012) Global Prevalence and Major Risk Factors of Diabetic Retinopathy. Diabetes Care, 35, 556-564.
https://doi.org/10.2337/dc11-1909
[4] 中华医学会糖尿病学分会视网膜病变学组. 糖尿病视网膜病变防治专家共识[J]. 中华糖尿病杂志, 2018, 10(4): 241-247.
[5] Magliano, D.J. and Boyko, E.J. (2021) IDF Diabetes Atlas. 10th Edition, International Diabetes Federation, Brussels.
[6] Yang, J., Wang, X. and Jiang, S. (2023) Development and Validation of a Nomogram Model for Individualized Prediction of Hypertension Risk in Patients with Type 2 Diabetes Mellitus. Scientific Reports, 13, Article No. 1298.
https://doi.org/10.1038/s41598-023-28059-4
[7] Klein, R., Klein, B.E.K., Moss, S.E., et al. (1995) The Wisconsin Epidemiologic Study of Diabetic Retinopathy. Archives of Ophthalmology, 113, 702-703.
https://doi.org/10.1001/archopht.1995.01100060024016
[8] Yang, Y., Cai, Z., Qiu, S. and Xu, P. (2024) Vision Transformer with Masked Autoencoders for Referable Diabetic Retinopathy Classification Based on Large-Size Retina Image. PLOS ONE, 19, e0299265.
https://doi.org/10.1371/journal.pone.0299265
[9] Atcı, Ş.Y., Güneş, A., Zontul, M. and Arslan, Z. (2024) Identifying Diabetic Retinopathy in the Human Eye: A Hybrid Approach Based on a Computer-Aided Diagnosis System Combined with Deep Learning. Tomography, 10, 215-230.
https://doi.org/10.3390/tomography10020017
[10] Li, A., Cheng, J., Wong, D. and Jiang, L. (2016) Integrating Holistic and Local Deep Features for Glaucoma Classification. 2016 38th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), Orlando, 16-20 August 2016, 1328-1331.
https://doi.org/10.1109/EMBC.2016.7590952
[11] Demir, F. and Taşcı, B. (2021) An Effective and Robust Approach Based on R-CNN+LSTM Model and NCAR Feature Selection for Ophthalmological Disease Detection from Fundus Images. Journal of Personalized Medicine, 11, Article 1276.
https://doi.org/10.3390/jpm11121276
[12] Ezhei, M., Plonka, G. and Rabbani, H. (2022) Retinal Optical Coherence Tomography Image Analysis by a Restricted Boltzmann Machine. Biomedical Optics Express, 13, 4539-4558.
https://doi.org/10.1364/BOE.458753
[13] Foysal, M., Hossain, A., Yassine, A. and Hossain, M.S. (2023) Detection of COVID-19 Case from Chest CT Images Using Deformable Deep Convolutional Neural Network. Journal of Healthcare Engineering, 2023, Article ID: 4301745.
https://doi.org/10.1155/2023/4301745
[14] 舒军, 杨露, 陈义红, 杨莉, 邓芳. 基于小数据集的改进LeNet图像分类模型研究[J]. 中南民族大学学报(自然科学版), 2019, 38(4): 605-612.
[15] 肖小梅, 杨红云, 易文龙, 万颖, 黄琼, 罗建军. 改进的Alexnet模型在水稻害虫图像识别中的应用[J]. 科学技术与工程, 2021, 21(22): 9447-9454.
[16] 伍思雨, 冯骥. 基于改进VGGNet卷积神经网络的鲜花识别[J]. 重庆师范大学学报(自然科学版), 2020, 37(4): 124-131.
[17] 张烽, 翁英健, 苏家明, 潘航露, 李馨, 郑尚知, 陈伟斌. 基于TV模型与GoogLeNet的甲状腺结节图像分类[J]. 计算机应用研究, 2020, 37(S1): 421-422, 417.
[18] 邱云飞, 张家欣, 兰海, 宗佳旭. 融合张量合成注意力的改进ResNet图像分类模型[J]. 激光与光电子学进展, 2023, 60(6): 87-96.
[19] 李赵旭, 宋涛, 葛梦飞, 刘嘉欣, 王宏伟, 王佳. 基于改进Inception模型的乳腺癌病理学图像分类[J]. 激光与光电子学进展, 2021, 58(8): 388-394.
[20] Li, J.-P.O., Liu, H., Ting, D.S.J., Jeon, S., Chan, R.V.P., Kim, J.E., Sim, D.A., Thomas, P.B.M., Lin, H., Chen, Y., Sakomoto, T., Loewenstein, A., Lam, D.S.C., Pasquale, L.R., Wong, T.Y., Lam, L.A. and Ting, D.S.W. (2021) Digital Technology, Tele-Medicine and Artificial Intelligence in Ophthalmology: A Global Perspective. Progress in Retinal and Eye Research, 82, Article 100900.
https://doi.org/10.1016/j.preteyeres.2020.100900
[21] Bogunović, H., Montuoro, A., Baratsits, M., Karantonis, M.G., Waldstein, S.M., Schlanitz, F. and Schmidt-Erfurth, U. (2017) Machine Learning of the Progression of Intermediate Age-Related Macular Degeneration Based on OCT Imaging. Investigative Ophthalmology & Visual Science, 58, BIO141-BIO150.
https://doi.org/10.1167/iovs.17-21789
[22] Grzybowski, A., Rao, D.P., Brona, P., Negiloni, K., Krzywicki, T. and Savoy, F.M. (2023) Diagnostic Accuracy of Automated Diabetic Retinopathy Image Assessment Softwares: IDx-DR and Medios Artificial Intelligence. Ophthalmic Research, 66, 1286-1292.
https://doi.org/10.1159/000534098
[23] 郭潇雅. 嵩岳机器人惊艳亮相[J]. 中国医院院长, 2018(14): 28-29.
[24] Chen, L.-C., Papandreou, G., Kokkinos, I., Murphy, K. and Yuille, A.L. (2017) Deeplab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs. IEEE Transactions on Pattern Analysis and Machine Intelligence, 40, 834-848.
https://doi.org/10.1109/TPAMI.2017.2699184
[25] Szegedy, C., Liu, W., Jia, Y., Sermanet, P., Reed, S., Anguelov, D., Erhan, D., Vanhoucke, V. and Rabinovich, A. (2015) Going Deeper with Convolutions. 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Boston, 7-12 June 2015, 1-9.
https://doi.org/10.1109/CVPR.2015.7298594
[26] Caicho, J., Chuya-Sumba, C., Jara, N., Salum, G.M., Tirado-Espín, A., Villalba-Meneses, G., Alvarado-Cando, O., Cadena-Morejón, C. and Almeida-Galárraga, D.A. (2022) Diabetic Retinopathy: Detection and Classification Using AlexNet, GoogleNet and ResNet50 Convolutional Neural Networks. In: Narváez, F.R., Proaño, J., Morillo, P., Vallejo, D., González Montoya, D. and Díaz, G.M., Eds., Smart Technologies, Systems and Applications, Springer, Cham, 259-271.
https://doi.org/10.1007/978-3-030-99170-8_19
[27] Sarwinda, D., Paradisa, R.H., Bustamam, A. and Anggia, P. (2021) Deep Learning in Image Classification Using Residual Network (ResNet) Variants for Detection of Colorectal Cancer. Procedia Computer Science, 179, 423-431.
https://doi.org/10.1016/j.procs.2021.01.025
[28] Duan, J., Shi, T., Zhou, H., Xuan, J. and Wang, S. (2020) A Novel ResNet-Based Model Structure and Its Applications in Machine Health Monitoring. Journal of Vibration and Control, 27, 1036-1050.
https://doi.org/10.1177/1077546320936506
[29] Zeng, L.Z., Cui, J., Jiang, T., Tu, L.P., Liu, H.D., Gong, Y.B., Xu, L. and Xu, J.T. (2023) Study on the Difference and Regularity of Tongue Images in 309 Patients with Different Pathological Stages of Non-Small Cell Lung Cancer. Technology and Health Care, 32, 1403-1420.
https://doi.org/10.3233/THC-230372
[30] Sreenivasu, S.V.N., Santosh Kumar Patra, P., Midasala, V., Murthy, G.S.N., Janapati, K.C., Swarup Kumar, J. and Kumar, P.M. (2023) ODQN-Net: Optimized Deep Q Neural Networks for Disease Prediction through Tongue Image Analysis Using Remora Optimization Algorithm. Big Data, 11, 452-465.
https://doi.org/10.1089/big.2023.0014
[31] Zhu, X., Wang, F., Mao, J., Huang, Y., Zhou, P. and Luo, J. (2023) A Protocol for Digitalized Collection of Traditional Chinese Medicine (TCM) Pulse Information Using Bionic Pulse Diagnosis Equipment. Phenomics, 3, 519-534.
https://doi.org/10.1007/s43657-023-00104-2
[32] Feng, Y., Hu, C., Cui, K., Fan, M., Xiang, W., Ye, D., Shi, Y., Ye, H., Bai, X., Wei, Y., Xu, Y. and Huang, J. (2023) GSK840 Alleviates Retinal Neuronal Injury by Inhibiting RIPK3/MLKL-Mediated RGC Necroptosis after Ischemia/Reperfusion. Investigative Ophthalmology & Visual Science, 64, Article 42.
https://doi.org/10.1167/iovs.64.14.42