运用深度学习技术检测转移性乳腺癌
病理学家利用显微镜对患者的肿瘤进行微观检查,是一直以来人们对癌症诊断的黄金标准,这一方法对癌症的预测和治疗决策也有着深远影响。针对从原 发部位扩散转移到附近淋巴结的癌症的检测,是病理检查过程中至关重要,但也举步维艰的一环。大多数癌症都涉及到淋巴结转移的检测,这项检测则成为了被广泛 采用的 TNM 癌症分期的基础诊断依据之一。
特别是在乳腺癌中,淋巴结转移会影响关于放射治疗、化疗以及可能需要手术切除额外淋巴结等情况的治疗决策。因此,对淋巴结转移进行准确、及时地 识别对临床护理具有重要影响。然而,研究表明,约1\4 的转移性淋巴结的分期在第二次病理检查的过程中会发生改变,而且,当检查时间有限时,单个载玻片上小转移的检测灵敏度可能降低至 38%。
去年,我们介绍了基于深度学习的方法,以提高 2016 ISBI Camelyon Challenge 癌症细胞区域检测竞赛的诊断准确性。该竞赛提供了来自乳腺癌患者淋巴结的高达 10 亿像素的病理载玻片,供研究者们研发用于诊断转移性癌症的计算机算法。虽然 LYNA 的癌症检测率明显高于之前的报告,但仅仅依靠准确的算法来改善病理学家的工作流程或乳腺癌患者的治疗结果是不够的。为了患者的安全,必须在大量的案例中对 这些算法进行测试,以此了解它们的优点和缺点。此外,这些算法为病理学家在使用过程中带来的实际益处在此前没有得到过证实,因此必须进行评估以确定其是否 能够真正提高诊断的效率或准确性。
在发表于《病理学和检验医学档案期刊》(Archives of Pathology and Laboratory Medicine)的论文“基于人工智能的乳腺癌淋巴结转移检测:对病理学家黑匣子的检测”和发表于《美国外科病理学杂志》(The American Journal of Surgical Pathology)的论文“深度学习辅助对转移性乳腺癌淋巴结组织病理学检查的影响”中,我们提出了一种基于 LYNA 的概念性病理学验证辅助工具,并对此进行调查研究。
在第一篇论文中,我们不再运用算法从 Camelyon Challenge 癌症细胞区域检测竞赛和批准用于研究 我们在圣地亚哥海军医疗中心的共著者提供的独立数据集中识别病理载玻片。由于这个额外的数据集来自不同实验室,经过了不同处理过程的病理样本组成,所以该 数据集提升了常规临床实践中的病理载玻片和人工制品的多样性。LYNA 证实了其能够在图像可变性和大量组织学特征上能够被稳定应用,并且在无需更多研发的情况下,在两个数据集中实现了相似的性能。
在两个数据集中,LYNA 能够以 99% 的正确率区分出有转移性癌症的载玻片和无转移性癌症的载玻片。此外,在每个载玻片内,LYNA 能够准确地查明癌症及其他可能患有癌症的位置,其中一些由于体积太小而不能被病理学家检测到。因此,我们推断 LYNA 的一个潜在效果可能是——重点标出这些区域,供病理学家在检查和作出最后诊断时参考。
在第二篇论文中,6 名有美国医生从业执照的专科病理学家完成了一项模拟诊断,在诊断中,他们分别在有 LYNA 的协助下和在没有 LYNA 的协助下对转移性乳腺癌的淋巴结进行检查。对于这种检测小转移(也可称为微小转移)的复杂的诊断,由于 LYNA 的使用,平均缩短了一半的时间,每张载玻片需要约一分钟的时间,而不再是两分钟,使人在主观上觉得“更简单”(根据病理学家的诊断难度自我报告)。
这表明 LYNA 等辅助技术具有令人兴奋的潜力,它可以减轻重复识别的负担,让病理学家能够把更多的时间和精力专注于其他更具挑战性的临床和诊断工作。在诊断的准确性方 面,病理学家在研究中使用 LYNA 能够更准确地检测微转移,将从检测中遗漏的微转移率降低两倍。令人感到振奋的是,使用 LYNA 协助的病理学家比没有使用 LYNA 协助的病理学家,或者比仅仅依靠 LYNA 算法本身的情况能够达到更准确的效果,这表明人们使用算法协助工作更有效率,比单独使用某一种检测方法实现更好的效果。
通过这些研究,我们在展示 LYNA 算法的稳健性(用以支持乳腺癌 TNM 分期的一个组成部分)和评估其在概念验证诊断设置中的影响方面取得了进步。这些进去非常令人振奋,但同时利用此类技术帮助医生及患者从科研试验到临床实践 的过程中还有很长的路要走。这些研究有很大的局限性,比如有限的数据库、模拟的诊断工作流程、仅单独检查每个患者的单个淋巴结的病理载玻片,而不是实际临 床病例中常见的检查多个淋巴结病理载玻片等。我们需要进一步评估 LYNA 对实际临床工作流程和治疗结果的影响。但是,经过仔细试验论证过的深度学习技术和精细设计的临床工具可以改善全球病理学家诊断的准确性和实用性,我们仍然 保持乐观。