作者:谢云明,郭光辉,林楚欣,
肺炎从感染途径可分为
传统实验室检测耗时且检出率低, 胸部影像学检查虽能快速诊断肺炎并对病原体有一定提示, 然而CAP 病原体种类繁杂,影像学特征重叠严重,精准鉴别始终是棘手难题。随着影像学技术与设备的更新,基于大数据的人工智能(artificial intelligence,AI)在该领域展现出巨大潜力,广泛应用于图像异常识别、解剖结构划分、质量评测以及诊断流程优化等医学影像场景。在众多AI 算法体系里,机器学习(machinelearning,ML)、深度学习(deep learning,DL)、影像组学应用较为普遍。
DL 是ML 的关键分支,基于神经系统科学理念模拟人脑神经元运行机制,具备自动提取目标多维度特征的能力, 在影像医学领域极具价值。AI 辅助鉴别诊断时,整合影像与临床信息形成多模态数据集并综合分析, 有助于构建更全面的患者画像,提升病原体鉴别能力。
其流程主要包括:1)收集临床信息(如实验室检查结果、症状描述、病史记录等);2)检测、识别、定位病灶并进行分割;3)分割肺部结构;4)图像预处理和特征提取;5)模型训练和优化。1)~4)为肺炎病原体的鉴别诊断提供关键信息,是构建模型的基础。
AI技术可应用于上述任何步骤, 以提升诊断的准确性和效率。
1. 儿童CAP病原体鉴别中AI的应用
儿童CAP的病原体以病毒为主,其次是细菌。准确鉴别病毒性、细菌性及非典型性CAP是执行经验性广谱抗生素治疗的基本依据。对于一些非重症且无危险因素的患儿,一般采取对症治疗;而对于需住院的危重症患儿,通常会进行病原体检测,如支气管肺泡灌洗、
同时鉴于抗原检测的特异性及敏感性均存在误差, 在临床中需综合考虑患儿的临床表现、病史、年龄以及检测结果,制定个体化的治疗方案, 在减少非必要抗生素使用的同时提高治疗效果。胸片和低剂量计算机断层摄影(low-dose computed tomography ,LDCT)在儿童肺部疾病的筛查、诊断发挥着关键作用,AI技术与之结合对儿童CAP病原体的鉴别具有巨大潜力。
1.1 AI辅助鉴别儿童病毒性肺炎
儿童急性
近年来,一些研究涉及到AI模型与影像学胸片的结合研究, 用于鉴别儿童病毒性肺炎与其他感染类型CAP。E等基于残差神经网络(residual neural network,ResNet)- 50基本网络构架构建的病毒性肺炎和细菌性肺炎DL 鉴别模型,采用梯度加权类激活映射技术(gradient-weighted class activation mapping,Grad-CAM)可视化模型识别胸片的重要区域, 并区分肺炎病因的影像学特征, 曲线下面积(area under curve,AUC)达0.919,将模型的性能与四位诊断专家的水平进行比较,在独立测试集中的表现与诊断专家水平相近。
这些研究主要集中在少数特定的病原体上,对类型的细分与影像学的应用仍然不足。因此,未来的研究应扩大儿童急性呼吸道感染病原体的覆盖范围, 并结合影像学和多模态数据以提高鉴别诊断能力。
1.2 AI辅助诊断
支原体需特定培养环境和较长的培养时间,限制了其微生物学鉴定方法的应用。为了快速识别儿童MPP, 学者们整合多种数据源形成多模态信息,构建了以临床信息、影像学、影像基因组学为基础的多种辅助诊断AI模型。Peng等基于27项
1.3 AI辅助鉴别儿童细菌性肺炎
2016 年全球约64%的5岁以下儿童肺炎死亡由细菌感染引发,若提高病原菌鉴别能力,将提升治疗效能, 降低死亡风险。文献表明将胸片、LDCT与影像组学、DL等AI技术相结合, 可提高儿童细菌性肺炎病原体鉴别诊断能力。Zhang等基于LDCT图像提取影像组学特征, 应用5个影像组学特征构建针对革兰氏阳性细菌性肺炎、革兰氏阴性细菌性肺炎和非典型性细菌性肺炎的影像组学鉴别诊断模型, 并使用支持向量机构建了临床-影像组学综合模型,结果显示该模型在训练组和验证组中的AUC分别为0.75和0.73,表明影像组学特征能为细菌性肺炎分类提供重要的辅助信息。
Wen等则在多种ML临床模型、DL影像学模型基础上,进行多模态决策融合,其诊断性能相较于仅依赖基于图像分类的DL模型有所提高,AUC达0.803,证实多模态信息有助于提升细菌性肺炎病原体诊断性能。尽管细菌性肺炎病原体鉴别诊断中AI技术展现出一定潜力,但相关研究仍较少。未来可通过加强多模态数据整合与复杂AI模型的探索, 进一步提升儿童细菌性肺炎病原体的早期诊断能力。
2. 成人CAP病原体鉴别中AI的应用
与儿童相比, 成人CAP病原体检出率通常较低,且细菌感染的发生率高于病毒感染。传统的诊断方法依赖于临床症状和实验室检测, 但这些方法的准确率和诊断效率有待提高。近年来,AI不仅用于鉴别SARS-CoV-2与其他多种成人CAP病原体,还在非SARS-CoV-2 CAP和病毒性肺炎的筛查或病原体鉴别中初见成效。
随着AI技术应用范围的不断扩大,除了用于病毒性肺炎、细菌性肺炎、真菌性肺炎的鉴别,还在特定病原体的识别方面发挥着重要作用,证实了AI在成人CAP病原体鉴别中的实用性。
2.1 AI基于胸片辅助鉴别成人CAP病原体
胸片是心肺部疾病诊断中最常用的成像技术之一,因其广泛的适用性、低廉的价格和较低的辐射量而著称。与AI技术结合不仅能辅助放射科医生对疾病影像进行分类和解读, 还能提供强有力的视觉支持,减少放射科医师之间的读片差异,提高诊断的一致性和准确性。
2.1.1 AI基于胸片辅助鉴别成人SARS-CoV-2与其他CAP
针对SARS-CoV-2、健康人群或非肺炎患者、病毒性肺炎、细菌性肺炎四分类问题,目前已开发出多种创新型DL模型,如CovXNet、冠状病毒病(coronavirus disease,COVID)-DSNet、MAG-SD、CXR-Net、CoroDet 、PulmoNet等,采用轻量级残差设计、深度可分离卷积、注意力引导增强、宽残差网络等最新技术,准确率普遍达到了83.5%~98.5%。
多数DL模型的构建依托于迁移学习技术,如借助ImageNet之类的大型公开数据集进行预训练, 深度学习肺部图像的一般性特征,为鉴定特定CAP病原体特征奠定基础;如借助自适应矩估计优化器或者随机梯度下降优化器所提供的优化策略,设计能与小型数据集的训练及测试环境相适配的模型, 为特定图像分析任务提供技术支撑与保障, 推动该领域研究工作的深入开展与技术创新。
此外,Hussain等证实了胸片的纹理特征与形态学特征对上述四分类的实用性;Schaudt等则在基线模型Grad-CAM的基础上构建了PneuKnowNet模型,有效应用了人类专家的图像注释,准确率达80.8%,证明专家先验知识能提升CAP鉴别诊断能力。
2.1.2 AI基于胸片辅助鉴别成人CAP病原体的精细分类
针对成人CAP等肺部疾病多分类问题,Althenayan等在非肺炎、细菌性肺炎和病毒性肺炎的基础上, 将病毒性肺炎进一步细分为SARS-CoV-2、流感病毒、呼吸道合胞病毒、腺病毒,并结合多种版本的生成对抗网络以合成新数据, 临床信息与胸片信息相结合形成的多模态数据能显著提高模型性能,ResNet-backbone多模态DL模型的准确率达95.6%。
Oh等则针对SARS-CoV-2早期数据稀缺的问题, 创新性地提出了一种基于局部区域(patch-based)的卷积神经网络(convolutional neuralnetwork,CNN)架构。该研究采用迁移学习与自监督学习相结合的策略, 通过无监督预训练任务的设计,显著降低了对标注数据的依赖。在模型架构方面, 研究者采用局部特征优先的Patch-basedCNN,相较于传统的端到端全局分类方法,能更精准地捕捉病灶的细微特征。
实验结果表明,在针对SARS-CoV-2、非肺炎、细菌性肺炎、病毒性肺炎和
此外,Sultana等结合2D-CNN和迁移学习进行肺部疾病分类,分别进行了四分类(非肺炎、SARS-CoV-2、细菌性肺炎、肺结核)以及联合纤维灶、病毒性肺炎形成的六分类, 准确率分别达97.8%、96.6%。Nahiduzzaman等提出了一种CNN-极限学习机器(extreme learning machine,ELM)融合模型, 将轻量级并行CNN的特征提取能力与ELM算法结合,以相对较少的参数和层次结构,实现在各种实际环境中迅速且精确地识别出17种肺部疾病,包括SARS-CoV-2、细菌性肺炎、病毒性肺炎和肺结核等,准确率达90.9%,展现了轻量级模型的潜力。以上研究表明,通过多模态数据整合、局部特征增强、迁移学习及轻量化架构设计,DL模型在肺部疾病精准分类与临床应用场景适配性方面具有广阔前景。
2.2 AI基于CT图像辅助鉴别成人CAP病原体
CT凭借其高分辨率成像、精准病灶定位、3D重建能力以及定量分析优势,已成为不可或缺的临床工具。其薄层多切片的特性虽然提供了丰富的影像细节,能清晰显示磨玻璃影、实变、小叶间隔增厚等特征性改变, 但同时也带来了海量数据的存储压力和处理挑战——单次全肺CT扫描可产生数百张图片, 这不仅对医疗机构的存储系统提出更高要求, 更对AI算法的计算效率形成严峻考验。未来,通过持续优化算法效率、完善硬件加速方案、建立标准化处理流程,CT技术在CAP病原体诊断中的应用将更加智能化、精准化和普惠化,最终实现从“影像诊断”到“精准治疗”的跨越。
2.2.1 AI基于CT图像辅助鉴别成人SARS-CoV-2、病毒性肺炎、细菌性肺炎
在SARS-CoV-2、病毒性肺炎、细菌性肺炎的鉴别工作中,Zheng等成功捕捉CT图像中的微小差异,ResNet-50骨干网络与SE(squeeze-and-excitation)注意力模块相结合,将多个断面图像作为输入,以充分利用断面图像之间的上下文信息, 并使用SE模块来学习多断面图像和多通道特征图像的不同重要性, 关注医学图像特有的多断面图像之间的关系, 成功捕捉CT图像中的微小差异, 其准确率达94.0%, 且诊断仅需20 ms, 显著提升了诊断效率。
Ahmad等提出了CT、胸片相结合的新型混合DL模型——Lightweight ResGRU,该模型使用残差模块和双向门控递归单元(bidirectional gated recursive unit,Bi-GRU),进行CAP病原体分类和SARS-CoV-2严重程度分级,测试集总体准确率达98.6%;其残差模块通过跳过连接增加神经网络深度, 提升训练效率;Bi-GRU计算残差单元能将中间层的特征关联到最后一个全连接网络进行分类, 提高分类的准确性; 同时该模型基于图像信息预测能力有助于解决不同类别的图像之间的相似性。
在SARS-CoV-2 与细菌性肺炎的鉴别研究中,Song等提出细节关系抽取神经网络(Details Relation Extraction neural network,DRENet)DL体系架构,结合ResNet-50和特征金字塔网络,提取局部与全局特征,成功实现个体层面的精准诊断,尤其在提取磨玻璃影等病变特征方面表现突出, 为临床的辅助诊断提供了直观视觉参照。此外。Kang等尝试通过采用K-means算法对胸部CT病变区域中提取的DL特征进行聚类分析,结合直方图信息与影像组学特征训练支持向量机分类器, 进行病原体分类及严重程度评估,准确率分别达91.2%和95.0%。该模型K-means算法具有两大显著优势:其一是可解释性,二是广泛的代表性,且不受特定训练疾病的影响。因此在对病情严重程度进行分类时,能够展现出较高的诊断准确性。
在SARS-CoV-2与病毒性肺炎的鉴别研究中,Xu等利用DL技术基于胸部CT图像开发了早期筛查模型,并提出了体素卷积神经网络-初始残差网络-区域建议网络[volumetric convolutional neural network(VNet)-inception-residual network(IR)-region proposal network(RPN)]3D-CNN分割模型,由VNet基础网络架构、Inception-Residual结构和区域提议网络组成, 主要用于胸部CT图像的分割和特征提取, 该模型通过对图像信息进行数字化和标准化处理,弱化了主观因素和熟练程度的影响,整体准确率达到了86.7%,为临床提供了极具前景的辅助诊断利器。这些研究共同推动了肺炎病原体AI鉴别技术的发展,从多模态数据融合、高效轻量化设计到可解释性增强, 逐步实现快速、精准的临床辅助诊断, 为肺部感染疾病的精细化分类提供了重要技术支持。
2.2.2 AI基于CT图像辅助成人真菌性肺炎筛查与鉴别
AI技术在真菌性肺炎识别方面也在不断革新。Wang等开发的侵袭性曲霉菌肺炎诊断神经网络(invasive pulmonary aspergillosis diagnostic neural network,IPA-NET)基于数据驱动与多模态融合策略实现显著突破。该模型通过迁移学习技术,利用公共数据库中30万张非真菌性肺炎CT图像进行预训练以提取基础肺部影像特征, 并针对病理确诊的IPA病例构建专属训练集,结合匹配的非真菌性肺炎病例数据优化模型特异性; 创新性整合29项临床特征与CT影像数据, 通过特征拼接模块实现多维度协同分析,并利用注意力机制可视化决策依据,精准定位空洞、多发结节及新月征等关键影像征象。
验证结果显示,模型内部测试准确率达96.8%,外部独立验证仍保持98.7%的准确率,优于传统临床评分模型(如Blot算法AUC为0.76)。该模型的应用需结合微生物培养或分子检测以补充不典型病例的漏检风险,未来需纳入非IPA真菌肺炎及异质性患者数据以进一步提升泛化能力, 凸显其在辅助诊断中的工具价值而非替代传统金标准。
此外,在
实验表明,融合临床-影像特征的多模态模型在内部验证集中AUC达0.92,诊断准确率为88.1%, 显著优于初级(40%)、中级(60%)放射科医师,略高于高级医师(75%);外部验证集AUC为0.83,显示良好泛化能力。通过随机森林算法筛选出半乳甘露聚糖试验、晕轮征、C-反应蛋白等关键临床特征, 为快速鉴别金黄色葡萄球菌肺炎与曲霉菌肺炎提供了量化依据, 可辅助基层医院减少抗生素滥用风险。
未来需扩大样本量以优化曲霉菌肺炎的特征学习。当前, 基于多种新的网络框架构建的病毒性肺炎、细菌性肺炎和真菌性肺炎分类模型,展现出了优异的性能,超过了放射医生的诊断水平。Zhang等提出了基于PyTorch框架的DL系统,通过多级决策流水线实现肺炎病原体的高效鉴别诊断。系统采用改进的3D ResNet-50网络对连续多切片CT图像进行预处理, 筛选含病灶的异常断面并提取3D上下文信息, 显著降低无效数据处理量。
引入病灶分割模块,精准定位肺叶轮廓及感染区域,为靶向治疗提供解剖学依据。通过双分类器与四分类器的级联架构, 结合多数投票机制整合断面预测结果,最终患者级分类性能优异(测试集AUC:SARS-CoV-2达0.995,病毒性肺炎0.994,细菌性肺炎0.984,真菌性肺炎0.991)。创新性引入沙普利加性解释(shapley sdditive explanation,SHAP)可解释算法, 解析关键CT特征, 辅助医生理解AI决策逻辑。
研究验证了CT影像联合临床特征的有效性(联合模型AUC达0.997),性能超越资深放射科医生。该系统目前专注于四类单一病原体鉴别,未来可扩展至混合感染检测及多中心数据验证, 为肺炎精准诊疗提供高效工具。此外,Wang等利用性能优越且计算需求较低的谐波密集连接网络(harmonic densely connected network ,HarDNet)算法训练了Pneumonia-Plus模型,该模型通过创新的轻量化设计,减少层间重复连接,在保持特征复用优势的同时,压缩浮点运算量,减少显存占用,通过采用4个HarD块提取特征及注意力机制动态聚合多尺度特征,提高了对小病灶的检测敏感度。
在独立测试集上, 其AUC分别达到了0.816、0.934和0.715,成功为基层医疗环境提供了具有成本效益和计算资源友好性的AI解决方案, 但真菌性肺炎的鉴别能力仍需进一步提高。这些研究共同推动了真菌性肺炎AI诊断的发展,从早期微小病灶检测到多模态融合,再到轻量化部署,逐步实现临床实用化。未来需进一步优化真菌性肺炎分类性能, 并探索更高效的算法以适应基层医疗需求。
2.2.3 AI基于CT图像辅助鉴别成人CAP病原体的精细分类
在AI辅助病原体精细分类领域, 近期研究取得了显著进展。Chen等利用深度诊断代理森林(deep diagnostic agent forest,DDAF)尝试对12种病原体(含病毒性肺炎、细菌性肺炎、真菌性肺炎、支原体等)进行精细分类,该模型由分割网络、特征提取骨干、DDAF和Top-K投票等四个模块组成,应用2D训练和体积级推理管道,AUC达0.851, 优于专家的平均诊断水平, 该研究标志着CAP病原体AI诊断从“粗分类”迈向“精细化”,但需警惕过拟合风险。
与此同时,Shao等开发的多模态整合的管道系统代表了当前肺炎AI诊断研究的最高复杂度与临床实用性的结合, 其创新性体现在多维度数据融合、病原体亚型鉴别及预后预测的三联功能设计。通过交叉注意力机制动态加权关键信息,将CT体积、结构化临床数据(如年龄、发热天数)、实验室指标(C-反应蛋白、白细胞计数)映射到统一特征空间,对齐异构数据。以64×256×256的3D体积为模型输入,保留全肺空间上下区域,通过扫描标准化层(如体素间距重采样)解决设备间差异,确保了扫描的兼容性和一致性。
该系统在病毒性肺炎、细菌性肺炎、真菌性肺炎及肺结核分类上表现优异,接近资深医师水平。该系统突破传统细菌/病毒二分法,细分至种属水平,高效地鉴别9种病毒和9种细菌病原体亚型,AUC分别达到0.822、0.803。同时还建立了融合DL特征和多维参数的重症预测模型, 能够为高危患者提供及时干预。然而,3D体积处理依赖图形处理器集群, 对计算资源需求高,难以在基层普及,实验室结果需手动录入,动态数据整合延迟。
此外,在一项多中心研究中,Shi等开发的病毒性肺炎、细菌性肺炎、真菌性肺炎、肺结核和非肺炎多分类DL模型,利用来自多个医疗中心的CT数据, 确保模型在不同设备、人群和扫描协议下的泛化性;通过多读者(不同经验水平的放射科医生)对比,证明模型在临床实践中的潜在价值,而非仅依赖内部测试集, 在外部测试集上的准确率分别为94.6%、51.1%、83.5%、84.5%和97.8%;采用ResNet-3D处理CT体积数据, 以128×128×128的3D体积为模型输入, 更好地捕捉空间特征;使用Grad-CAM可视化模型关注区域,帮助医生理解AI决策依据; 提出模型作为辅助工具的潜在应用场景,并量化其对诊断效率的提升,为肺炎病原体影像鉴别领域提供了重要的技术参考。
其中细菌性肺炎的分类准确率较低, 可能与细菌性肺炎的样本量较小相关, 由此可见即使多中心数据仍可能遗漏关键亚型,未来需建立动态病原体库。这些研究共同推动了病原体鉴别从肺炎筛查到大类区分再到种属识别的演进, 虽然当前涵盖的病原体种类仍有限, 但通过动态病原体库建设和计算优化, 未来有望进一步扩展鉴别范围并提升精度,为临床提供更精准的决策支持。值得注意的是,3D处理、多模态融合和可解释性已成为技术发展的关键方向, 而计算资源需求和数据整合效率则是亟待突破的应用瓶颈。
3. 技术挑战与对策
AI技术在CAP病原体影像学鉴别诊断方面虽有一定提升,但仍处于探索阶段,部分病原体的分类精度不足,与临床实际需求有差距。未来需重点探索交叉感染、耐药性及耐药基因、特殊病原体识别等方面的AI模型。当前面临的核心挑战集中在数据质量、技术落地、科学严谨性及临床应用便捷性等方面。
具体而言:1)数据量不足与分布不均仍是瓶颈,多数研究依赖单中心、小样本数据,且病原体类型、患者年龄范围及地域覆盖不全,导致模型泛化能力受限。2)软硬件可操作性矛盾突出:复杂DL模型(3D CNN、多模态融合网络)依赖高性能算力,难以适配基层医疗的低配置设备,限制了普惠化应用;3)实验可重复性不足:源于数据隐私壁垒与代码开源缺失,仅少数研究公开数据集或模型细节(如COVID-Net),导致同行验证困难;4)结果可信度争议:源自“黑箱”决策机制与临床验证脱节, 例如影像模型缺乏病原学对照,而部分研究仅依赖内部测试集,外部验证不足;5)方法简便性短板:体现在多模态数据融合的复杂性(如联合CT、血液指标、文本描述)及操作流程的专业化门槛,阻碍临床快速部署。
未来应开发更强大、适应性更广的AI 模型,以实现快速精准诊断,改善患者治疗效果和预后。为此,除了要不断优化算法架构,探索半监督和自监督学习方法,加强跨学科合作,整合多领域知识等内容之外,还应完善以下方面:1)数据扩容与标准化:建立跨机构、跨地域的多中心数据库,利用联邦学习和合成数据技术平衡数据隐私与共享,同时制定统一标注标准(如肺部边界标注规范);2)轻量化技术与边缘计算:开发压缩模型(如轻量级CNN、ResGRU)及适配移动端的推理框架,通过知识蒸馏降低计算需求;3)开源生态与可重复性保障: 推动研究社区开源代码及预训练模型,构建标准化测试基准(COVID-19/CAP公开数据集);4)可解释性与临床验证闭环:集成注意力机制、置信度校准及多学科验证流程(如病原体-影像-临床联合分析),强化模型决策透明性;5)端到端自动化流程设计:开发一体化诊断平台,简化多模态数据输入与结果解读,并通过人机协同(专家知识蒸馏)降低操作门槛。
来源:谢云明,郭光辉,林楚欣,等.社区获得性肺炎病原体影像鉴别中人工智能的应用进展[J].影像诊断与介入放射学,2025,34(02):123-131.
(本网站所有内容,凡注明来源为“医脉通”,版权均归医脉通所有,未经授权,任何媒体、网站或个人不得转载,否则将追究法律责任,授权转载时须注明“来源:医脉通”。本网注明来源为其他媒体的内容为转载,转载仅作观点分享,版权归原作者所有,如有侵犯版权,请及时联系我们。)