人工智能GRAIDS媲美内镜医师,徐瑞华教授团队有望实现上消化道肿
上消化道肿瘤(包括和)是最常见的恶性肿瘤之一,也是全球范围内癌症相关死亡的主要原因。上消化道肿瘤早诊早治是提高疗效的。而及仍是上消化道癌早期诊断的金标准。目前,中国的内镜医生十分短缺,另一方面,由于早期上消化道肿瘤常缺乏典型的内镜下表征,极易漏诊,加之其他因素,导致中国早期上消化道肿瘤的检出率低(不到10%)。中山大学肿瘤防治中心的徐瑞华教授团队开展了一项研究,成功研发出上消化道癌内镜人工智能辅助诊断系统,该研究结果近日刊登在《刀· 肿瘤学》杂志(影响因子:35.386)。
研究背景
大多数上消化道肿瘤诊断时为晚期,总体预后不良,如果及早发现,其5年生存率可超过90%。 上消化道内镜技术,例如窄带成像放大内镜和共聚焦激光内镜技术已在国家开展,这使上消化道肿瘤的检出率增加、死亡率降低。但是,在欠发达地区或偏远地区,甚至在许多进行内镜检查的国家,上消化道肿瘤的内镜检查的漏检率仍然很高。 利用深度学习算法的人工智能在医学成像领域取得了重要进展,但在上消化道肿瘤领域的应用却十分有限。本研究旨在通过分析临床内镜的成像数据,开发和评估胃肠道人工智能诊断系统(Gastrointestinal Artificial Intelligence Diagnostic System ,GRAIDS)用于诊断上消化道肿瘤的潜能。
研究方法
这项多中心、病例对照、诊断性研究在中国六家不同级别的医院开展。从所有参与医院中收集未曾接受过内镜检查的18岁或以上受试者的连续图像。经组织学证实为上消化道恶性肿瘤(包括和胃癌)的患者符合入组标准。中山大学肿瘤防治中心的图像被随机分配(8:1:1)用于、开发GRAIDS的本底验证数据和评估GRAIDS性能的验证数据。使用中山大学肿瘤防治中心以及其他5家医院的前瞻性数据验证其诊断性能。并将GRAIDS的性能与三个专业等级的内镜医师进行对比。评估GRAIDS和内镜医师对癌病变鉴别的诊断准确性、敏感性、特异性、阳性预测率和阴性预测率。
研究结果
2009年1月12日至2017年9月30日期间,收集了20352例患者的314726张上消化道内镜图像(图1),排除了1587例(7.8%)患者的图像,最终纳入了癌症病变患者的图像(n= 39462),将未患癌症的11745例患者作为照组,2018年7月21日至11月20日期间,SYSUCC前瞻性地收集并登记了4317张癌症患者的图像和62433张对照组图像,加上其他五家医院收集的数据,共有来自84424例患者的1036496张内镜图像用来开发和测试GRAIDS。
试验组、本底验证组、内部验证组、前瞻性验证组中上消化道肿瘤的患病率分别为50.2%(7557/15040)、51.0%(938/1839)、50.8%(959/1886)和32.0%(574/1794)。
在所有7个验证亚组中,GRAIDS对上消化道肿瘤患者的识别率较准确(表1)。在SYSUCC内部验证组、前瞻性验证组中的诊断准确率分别为0.955 (95% CI 0.952 ~0.957)和0.927(0.925~0.929)。外部验证的准确率也较高,省肿瘤医院、广东省人民医院、梧州市红十字会医院、普宁人民医院、揭阳市人民医院的准确率分别为0.915、0.949、0.977、0.970、0.947。在所有验证组中,GRAIDS的敏感性、特异性、阴性预测率(NPV)都超过90%,阳性预测率(PPV)从0.384到0.889不等。所有验证组中,假阳性率均低于10%。
同样,在5个外部验证组中均观察到了较高的AUC值(0.966[0·965-0·967]~ 0.990[0.990 – 0.991])。
GRAIDS和内镜医师鉴别前瞻性验证收集的4532张图像,其中1102张(24.3%)癌症图像和3430张(75.7%)对照图像,测试结果见表2。GRAIDS检测上消化道肿瘤的准确率为0.928 (95% CI 0.919~0.937)。
三类内镜医师和GRAIDS诊断的特异性均大于0.90。相比之下,内镜医师的敏感度差异很大,GRAIDS与内镜专家的敏感度相似(0.942 vs 0.945),而其敏感性显著高于普通内镜医师(0.858,P<0.0001)和实习内镜医师(0.722,P< 0.0001)。
GRAIDS的PPV为0.814,准确性明显低于内镜专家(0.932,P<0.0001)和内镜医师(0.974, P<0.0001),但与实习内镜医师类似(0.824,P=0.580)。
当联合GRAIDS使用时,专家、医师和实习医师的PPV均显著下降(0.793、0.812、0.747,所有P< 0.0001)。
GRAIDS能够鉴别出大多数会被内镜医师错误分类的癌症图像,其中,内镜专家、内镜医师、实习内镜医师分别占70.5%(43/61)、84.7%(133/157)、86.9%(266/306)。
当联合GRAIDS时,专家的敏感性可以得到显著改善(0.984,P<0.0001),内镜医师(0.978,P<0.0001)和实习内镜医师(0.964, P<0.0001)的敏感性也得到显著改善,与专家水平相近。
研究结论
GRAIDS在检测上消化道肿瘤方面具有较高的诊断准确性,敏感性与内镜专家相近,优于普通内镜医师。GRAIDS人工智能系统可辅助社区医院的诊断和检查,以提高上消化道肿瘤诊断的有效性。