VisionPro Deep Learning 识别 COVID-19 肺部 X 射线影像

最近成功应用康耐视 VisionPro® Deep Learning 软件识别 COVID-19 肺部 X 射线影像的案例(打败了世界各地生命科学研究团队的多种其他深度学习模型)由春季出版的重要人工智能杂志 SN Computer Science 进行了同行评议和发表。“使用深度学习通过胸部 X 射线影像识别 COVID-19 图像:康耐视 VisionPro Deep Learning 1.0 软件与开源卷积神经网络的对比”1 经过几个月的科学界同行评议后,于 2021 年 3 月发表。
该论文是以滑铁卢大学提供的公开胸部 X 射线数据集为基础编写的。在康耐视资助的这项研究中,康耐视生命科学团队使用 VisionPro Deep Learning 1.0 软件分析 COVID-19 阳性的胸部 X 射线影像,然后与健康人群或非 COVID-19 肺炎患者的胸部 X 射线影像对比,从而解决识别 COVID-19 图像的问题。在后续论文中,该团队比较了使用 VisionPro Deep Learning 软件识别 CT 扫描中的 COVID-19 指征的效果。该论文还探索了如何更快且更方便地编程,并再次取得明显积极的成果。
X 射线,CT 扫描和 COVID-19
X 射线等医学影像可为医生和放射科医生提供 COVID-19 实验室测试准确性的视觉证据。另外,训练方式与儿童学习相似、不使用复杂算法的深度学习软件可以分析数千医学影像并确认能否支持某一诊断的异常情况,从而减轻医生负担。
大部分常见开源深度学习工具的一个障碍就是需要大量的编程专业知识才能使用。希望医生、放射科医生等医疗保健工作人员掌握这些工具是不现实的。
今年夏天,康耐视的人工智能 (AI) 专家团队通过一个假设开始着手解决这个障碍:康耐视的工业自动化软件能否提供简单易用且可以媲美世界上最常用开源深度学习工具的替代工具?这项名为“使用深度学习通过胸部 X 射线影像识别 COVID-19 病症图像:康耐视 VisionPro Deep Learning 1.0 软件与开源卷积神经网络的对比研究”,对比了康耐视 VisionPro DL 计算机神经网络 (CNN) 和多个主要开源 CNN 的 X 射线评估,其中包括 VGG19、ResNet、DenseNet、Inception 和 COVID-NET - 这是滑铁卢大学专为检测 COVID-19 胸部 X 射线影像开发的 AI 创建 CNN。
Arjun Sarkar、Joerg Vandenhirtz、Jozsef Nagy、David Bacsa 和 Mitchell Riley(均为康耐视生命科学团队成员)编写的论文通过同行评审后,已经吸引了多家主要研究出版商的注意。
“我们很惊讶使用软件区别 X 射线影像上的病理特征是如此简单,”康耐视生命科学高级 AI 专家 Vandenhirtz 说。“让人类区分 X 射线影像上的各种病理特征几乎是不可能的。对于这种图像,五个放射科医生可以给出五种不同的解释。”
研究 1:VisionPro Deep Learning 脱颖而出
康耐视的研究以加拿大安大略滑铁卢大学的研究“COVID-Net:定制深度卷积神经网络探测胸部 X 射线影像中的 COVID-19 病例”的结果为基础。使用了 COVID-X 数据集中的近 14,000 张胸部 X 射线影像。合著者 Linda Wang 和 Alexander Wong 使用了人工智能建立 COVID-Net,这是用于分析 X 射线的成熟神经网络,可以识别有 COVID-19 症状的肺部。
一个名为 F-score 的评估对尝试准确地预测数字图像模式和异常的深度学习系统的整体准确性进行了评估。基本上,F-score 就是深度学习系统生成的正确预测相对错误预测的百分比。
康耐视的研究人员使用 COVID-Net 数据集中的近 14,000 张 X 射线图像对深度学习工具进行了培训。这些图像分三类:正常,非 COVID-19 肺炎和 COVID-19。正如此对比多个深度学习包的表格所示,COVID-Net 生成了很强的预测性结果,F-Score 范围为正常图像 92.6% 到 COVID-19 图像 94.7%。VisionPro Deep Learning 1.0 做得更好,正常 X 射线影像 F-Score 为 95.6%,COVID-19 X 射线影像为 97.0%。
研究 2:VisionPro Deep Learning 在 CT 扫描方面扩大了优势
同一研究团队一份更新的康耐视论文将研究范围从胸部 X 射线影像扩展到了胸部 CT 扫描。虽然很多研究已经证明使用深度学习通过 CT 扫描和 X 射线图像探测 COVID-19 病症图像是成功的,但其中大部分深度学习架构都不提供培训系统所需的图形用户界面 (GUI),所以需要大量编程工作。缺少深度学习或编程知识的放射科医生很难使用这些程序,更不用说训练这些程序了。

因为效果和易用性是后续研究的两个主要内容,所以康耐视的最新研究测试了 VisionPro Deep Learning 能否成功识别 COVID-19 和非 COVID-19 肺炎图像,以及需要多少培训才能获得很高的 F 分数。后续论文“使用深度学习通过胸部计算机断层 (CT) 扫描识别 COVID-19 病症图像:COGNEX VisionPro Deep Learning 1.0 软件与开源卷积神经网络的对比”使用了滑铁卢大学视觉和图像处理实验室 Linda Wang 团队的数据集,其中包含 100,000 多张专门标记过的图像。除 CNN 外,我们还使用其他一流 CNN 对康耐视 VisionPro Deep Learning 做了基准测试,其中包括滑铁卢大学的 CNN 架构 COVID-Net-CT-A 和 COVID-Net-CT-B,以及谷歌最新的 CNN 架构 Xception。
如下表所示,与所有其他 CNN 网络架构相比,康耐视 VisionPro Deep Learning 1.0 的表现均较好,所有三类(正常、非新冠肺炎和新冠)的 F 分数 > 99.4。初步研究将 100,000 原始图像 CT 扫描数据集分成两组:培训组 61,783 张图像,“测试”组 21,191 张图像,由各 CNN 在训练后进行分析。
为了了解“训练”现有 X 射线 CNN 评估普通、COVID-19 和肺炎疾病需要多少图像,康耐视又使用 26,338 张图像而不是 61,000 多张图像重新对康耐视 CNN 进行了培训。如下表所示,对各 CNN 的 F 分数进行了对比。康耐视 VisionPro Deep Learning 与其他 CNN 架构相比优势明显,所有三类图像(正常、新冠、非新冠肺炎)F 分数 > 99.1,而所有其他 CNN 均降至接近九十至九十五左右,特别是病理有相关性的两类:肺炎和 COVID-19。
深度学习为放射科医生提供了强大的诊断工具
虽然康耐视前两次研究的结果仍然需要其他医学研究人员进行验证,但初步结果还是很令人期待的。另外,该软件尚未获批用于医疗用途。
Vandenhirtz 表示公司的主要短期兴趣是将这种软件的能力告诉全球医学社区。它还可能在其他领域发挥作用,例如依赖眼睛内部机制图像的眼科。
虽然深度学习算法能力很强,但它并不能完全代替人类医生的智慧,Vandenhirtz 说。但是,就像听诊器或血压袖套一样,它是一种有用的工具,可以帮助医疗保健专业人员更好地完成工作。
“我们认为,至少在短到中期,AI 还不能独自完成诊断,”他总结说。“VisionPro Deep Learning 可以提供建议,但是最终还需要放射科医生来判断图像的意义。”
从此处访问 SN Computer Science 论文:使用深度学习通过胸部 X 射线影像识别新冠图像:COGNEX VisionPro Deep Learning 1.0™ 软件与开源卷积神经网络的对比。
1Springer 论文引用:Sarkar, A., Vandenhirtz, J., Nagy, J. et al.使用深度学习通过胸部 X 射线影像识别新冠图像:COGNEX VisionPro Deep Learning 1.0™ 软件与开源卷积神经网络的对比。SN COMPUT.SCI.2, 130 (2021). https://doi.org/10.1007/s42979-021-00496-w