当新型冠状病毒(Covid-19)疫情开始在世界范围内拉响警报时,康耐视的深度学习专家开始思考这项技术是否能够帮助医护专业人员进行有效的防御。
事实已经证明,这一警报是有道理的。截至2020年11月下旬,Covid-19已在全球范围内感染超6000万人,并夺去了逾140万人的生命。全球各地的临床医生都面临着类似的挑战:依靠实验室检测来确认新冠病例非常耗时,可能会延误诊断和治疗。虽然x射线及其他医学成像技术可以快速确认新冠病例诊断,但很容易对这些图像的含义进行错误解读。
康耐视的深度学习团队审视了这些挑战,并意识到他们专为生产线的自动化和优化而开发的软件包可能能够提供医学成像组件解决方案,用于应对本次全球疫情挑战。
将深度学习与医学影像相结合的价值
x光片等医学图像对于确认COVID-19诊断至关重要,为医生和放射科医师提供视觉证据,证明实验室检测是准确的。此外,深度学习软件可以分析数以千计的医学图像,并识别出推翻或支持诊断的异常情况,从而减轻临床医生的工作量。
但是,这存在一个障碍:最流行的开源深度学习工具难以使用,而且需要大量的编程专业知识。期望医护人员(包括医生、放射科医师及其他临床医生)掌握这些工具是不切实际的。
为了克服这一障碍,康耐视的一个AI专家团队开始着手解决一个基本问题,即:康耐视的工业自动化软件能否提供一种易于使用并且可以与世界顶级开源深度学习工具的性能相匹配的替代工具?
针对这一假设进行的开放测试显示出巨大的潜力。由康耐视的五名深度学习专家组成的团队进行的一项研究表明,康耐视的先进机器视觉软件的准确性可以媲美甚至超越世界领先的开源深度学习工具。
该研究的标题为“使用深度学习技术识别X光片中的新型冠状病毒(COVID-19):将康耐视VisionPro Deep Learning 1.0软件与开源卷积神经网络进行比较”,其已经引起了主要研究出版商的注意。共同作者包括Arjun Sarkar、Joerg Vandenhirtz、Jozsef Nagy、David Bacsa和Mitchell Riley,他们都在康耐视生命科学团队工作。
“我们惊讶地发现,该软件可以轻松对X光片上出现的各种病理形态进行区分,”来自康耐视生命科学团队的高级AI专家Vandenhirtz表示,“人类几乎不可能找出X光片中不同病理形态之间的差异。对于这类图像,五名放射科医师可能会给出五种不同的意见。”
Vandenhirtz为这项研究提供了协调支持,以帮助将康耐视的先进机器视觉技术扩展到医疗保健和生命科学领域。新型冠状病毒在全球范围内大规模传播带来了紧迫性,而COVIDx(来自COVID-19胸部x光片的大量数据集)则为这项研究提供了测试图像。他聘请了Sarkar进行实验,并在研究报告中总结了他的实验成果。Sarkar目前在位于德国亚琛(Aachen)的应用科学大学(University of Applied Sciences)攻读生物医学工程专业硕士学位。
Vandenhirtz表示,Sarkar在TensorFlow的使用方面具有强大的背景,TensorFlow是来自谷歌的领先深度学习平台。TensorFlow要求程序员在基于文本的终端界面中构建自己的模型。相比之下,VisionPro Deep Learning软件具有使用方便的图形用户界面(GUI),无需编程经验。
COVID和深度学习技术研究的基础
康耐视的研究基于加拿大安大略省滑铁卢大学(University of Waterloo)进行的一项研究的结果。该研究的标题为:“COVID-Net:专为从胸部X光片中识别COVID-19病例而量身定制的深度卷积神经网络设计”,在一个名为COVIDx的数据集中收集了近14,000张胸部X光片。共同作者包括Linda Wang和Alexander Wong,他们使用开源深度学习软件包构建了COVID-Net,这是一个复杂的神经网络,其可以分析X光片,并学会识别显示出COVID-19迹象的肺部。
来自滑铁卢大学的一组研究人员成立了一家名为DarwinAI的创业公司,专门开发商业化深度学习软件,以挖掘COVID.Net等资源的价值,这类软件资源前景广阔,但仍然面临着基本的可用性挑战。
“目前,这还只是数据科学家可以利用的一种非常技术性的实施方式,而放射科医师和医护人员肯定无法使用,因此,我们需要将其整合在一个非常易于使用的适当应用程序用户界面中,确保即使不熟悉这项技术的人员也可以充分加以利用,”DarwinAI首席执行官Sheldon Fernandez在接受CDNet的采访时表示。
康耐视研究人员了解这些局限性的含义。VisionPro Deep Learning软件是康耐视专为制造业领域的客户开发的。该软件的开发人员进行了专门设计,以确保工厂管理人员和技术人员可以使用深度学习技术来分析其生产线上的图像,以维持质量控制,并及时识别出有缺陷和损坏的产品,以防止它们流入市场。
举例来说,在一家汽车工厂中,康耐视的机器视觉相机首先采集挡泥板、发动机缸体等元件的数字图像。然后,VisionPro Deep Learning软件将扫描这些图像,以识别出划痕、凹痕及人工检测员往往遗漏的其他异常情况。及早发现这些缺陷可以使生产线实现更高的生产率,并提高产品质量。此外,该软件还可以用于对元件或缺陷进行分类、定位元件和验证装配。这些类型的检测任务目前通常仍然由人工检测员完成,或者无法得到充分执行,因为它们本质上需要利用人类的判断力。
VisionPro Deep Learning软件在COVIDx数据集分析方面的表现如何
一项称为F分数的测量对于深度学习系统的整体准确性进行了评估,该系统尝试准确地预测数字图像上的图案和异常。康耐视的研究人员分析了COVID-Net数据集中的近14,000张X光片图像。这些图像被分为以下三种类型:正常、非COVID-19肺炎和COVID-19肺炎。
正如下面的表格中对多个深度学习软件包进行的比较所示,COVID-Net产生了准确的预测结果,正常图像为92.6%,COVID-19肺炎图像为94.7%。VisionPro Deep Learning软件的效果甚至更佳,正常X光片图像为95.6%,COVID-19肺炎X光片图片为97.0%。
当然,这只是一项研究。尽管康耐视团队使用行业标准方法进行研究和统计分析,但其他研究人员是否能够复制该结果仍有待观察。
Vandenhirtz表示,康耐视短期内的主要关注点是向全球医学界介绍这种软件的功能,该软件在计算机断层扫描(CT)领域也显示出了令人鼓舞的结果。此外,该软件在眼科学(其依赖视网膜图像)、数字病理学(其使用组织学切片的显微图像)等领域也可能被证明是有用的。
Vandenhirtz表示,就其所有功能而言,深度学习算法无法完全取代人类临床医生的智慧。但是,跟听诊器或血压袖带一样,该软件是帮助医护专业人员高水平执行工作的一种有用工具。
在这种背景下,康耐视VisionPro Deep Learning软件提供了有用的热图功能,其突出显示了图像中对于分类非常重要的区域。黄色到红色区域很重要,而绿色到蓝色区域对于决策算法并不重要。
在现实世界中,这种热图功能使该工具不仅可以为潜在的诊断提供建议(即Covid-19阳性或阴性),还可以识别出检测到相应疾病症状的区域。这一点很重要,因为它可以帮助放射科医师在图像的特定区域进行归零校正,以使他们能够验证或推翻AI诊断,从而防止该软件工具因错误的原因无法做出正确的决策。
“我们认为,至少在短期到中期内,AI技术无法进行诊断,”他总结道,“VisionPro Deep Learning软件可以提出建议,但最终,放射科医师仍然必须对图像的含义作出决定。”
最后,他补充道,虽然AI技术不会取代放射科医师,但它将取代不使用AI技术的放射科医师。
2024-11-15
2024-11-19
2024-11-19
2024-11-18
2024-11-15
2024-11-21
2024-11-21
在E维智库第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,我们有幸见证了一系列关于未来汽车技术的精彩演讲。这些演讲不仅展示了LED照明、射频技术、高性能存储器、端侧AI应用、以及SiC技术在新能源汽车领域的最新进展,还揭示了这些技术如何塑造智能汽车的未来。
评论
加载更多