消化系统疾病国家临床医学研究中心

中心公告

《胃肠病学》前沿速递——第25期:基于人工智能的自主光学诊断的准确率并不低于人工智能辅助内镜医生

发布时间:2024-07-29 18:22:40 浏览次数:
字号:

引言

《胃肠病学》(Gastroenterology)是美国胃肠病学会(American Gastroenterology Association,AGA)的官方杂志,是国际消化病学领域的顶级学术期刊,提供了胃肠病学基础和临床研究的最新和权威报道。首都医科大学附属北京友谊医院是国家消化系统疾病临床医学研究中心和消化健康全国重点实验室依托单位,是AGA在中国唯一官方指定授权发布《胃肠病学》杂志翻译的单位。

每月两期,一起了解胃肠疾病学术前沿信息!

第25期

微信图片_2026-03-30_174002_223.jpg

自主人工智能VS人工智能辅助人类对结直肠息肉的光学诊断:一项随机对照试验

通讯作者:

Daniel von Renteln,加拿大蒙特利尔大学医院中心消化内科和蒙特利尔大学医院研究中心

背景与目的

基于人工智能(AI)的光学诊断系统(CADx)已经被开发用于在结肠镜检查中预测结直肠息肉的病理类型。然而,CADx尚未被验证其自主性能。因此,本研究通过一项临床试验,比较了自主AI和AI辅助人类(AI-H)的光学诊断能力。

方法

对在同一个学术机构接受择期结肠镜检查的患者进行了随机非劣效性试验。患者被随机分为两组:(1)自主AI组,基于AI的对微小息肉进行自主CADx光学诊断,没有人工参与;(2)AI-H组,由内镜医生在看到实时CADx诊断后对微小息肉做出光学诊断。主要结果是以病理为金标准,两组光学诊断的准确率。次要结果包括与基于病理建议的监测间隔的一致率。

结果

本研究共纳入467例患者(自主AI组患者238例/息肉158个,AI-H组患者229例/息肉179个)。自主AI组的光学诊断准确率为77.2%(95%置信区间[CI],69.7-84.7),而AI-H组为72.1%(95% CI,65.5-78.6)(P=0.86)。在内镜医生对预测病理诊断的把握较高的病变中,自主AI组的诊断准确率为77.2%(95%CI,69.7-84.7),而AI-H组的诊断准确率为75.5%(95%CI,67.9-82.0)。与AI-H组相比,自主AI组与基于病理建议的监测间隔的一致率明显更高(91.5% [95%CI,86.9-96.1] vs 82.1% [95% CI, 76.5-87.7];P=0.016)。

结论

AI的自主光学诊断准确率并不低于基于内镜医生的诊断。自主AI和AI-H在光学诊断方面的准确率都相对较低,但自主AI与基于病理建议的监测间隔的一致率更高。

微信图片_2026-03-30_174007_777.jpg

图文摘要

研究亮点和启示

微小结直肠息肉(直径1-5mm)占被检测出的结直肠息肉的70%-80%,对此类息肉的光学诊断已经被证明可以代替组织学诊断,因此,根据光学诊断的结果实施“切除-丢弃”和“发现-保留”等策略可以安全地节约成本,进而被应用于结直肠癌的筛查项目。美国消化内镜学会在其保存和整合有价值的内镜创新(PIVI)的建议中提出了实施光学诊断策略的基准:对直肠、乙状结肠腺瘤来讲,当与基于病理建议的监测间隔一致率≥90%时可以实施“切除-丢弃”策略,当≥90%阴性预测值(NPV)时可以实施“发现-保留”策略。虽然光学诊断在学术机构中已经取得了很高的准确性,但这些策略并未广泛应用于一般的临床实践中,最主要的障碍是大多数内镜医生担心出现误诊,而使用AI进行诊断可能有助于减轻这些担忧,并能够使内镜医生更广泛地采用光学诊断的策略。

CADx已经被开发用于结肠镜检查中预测结直肠息肉的病理诊断。已有研究表明,当使用AI-H诊断时,高度契合PIVI阈值。然而,CADx尚未被验证其自主性能。所以,本研究开始在一项随机对照的非劣效性试验中研究自主AI与AI-H相比的表现,这是迄今为止第一项评估没有人工干预的AI自主实施的研究,其结果是发人深省的,可能对引入AI进行内镜下息肉诊断具有重要意义。

本研究发现,自主AI组建议的监测间隔与基于病理建议的监测间隔的一致率显著高于AI-H组(91.5% vs 82.1%,P=0.016),这突出了人工与AI模块交互的复杂性,在某些情况下,人工干预可能导致结果变差。出现此类现象可能是由于内镜医生对AI的不信任,或对基于AI的诊断有一种优越感,后续还需要进行更多的研究来阐明这一现象。 

很少有研究评估基于CADx的光学诊断的有效性。一项研究发现,当使用CADx时,监测间隔的一致率可达到96%,而内镜医生进行诊断时,监测间隔的一致率也可达到96%。然而,该研究并没有使用美国多学会工作组建议的所有可选择的监测间隔(1年、3年、3-5年、5-10年和7-10年),而是选择1年、3年或10年作为监测间隔。此外,没有息肉的患者也被纳入了上述监测间隔一致率的计算,这可能会放大一致率的百分比,而在本研究中则排除了这些患者。虽然本研究发现AI-H组的一致率较低,但是,该一致率计算中只包括了发现息肉的患者,这或许会更好地代表自主AI和AI-H两组在目标人群中的效能。此外,考虑到CADx目前不能诊断锯齿状病变(SSLs),而且自主AI组中所有SSLs都自动被认为是不正确的(在自主AI组中占微小息肉的3.8%,在AI-H组占2.8%),这说明自主AI组的诊断效能还有进一步改善的潜力。该技术的未来迭代应该包括对SSLs的评估。未来的CADx版本经过识别SSLs的训练,很有可能会提高自主AI的诊断能力,进而超越AI-H。考虑到即使现阶段CADx没有诊断SSLs的能力,其研究结果也能达到超过PIVI1和PIVI2阈值诊断的能力,所以仍强烈推荐在常规实践中使用CADx。

译者简介

译者:乔新伟

微信图片_2026-03-30_174010_040.jpg

医学博士,首都医科大学附属北京友谊医院消化内科主治医师,首都医科大学讲师。中华医学会消化内镜分会静脉曲张学组青年委员,在国内外专业学术期刊发表论文十余篇,主持及参与多项临床医学研究项目。获首都医科大学附属北京友谊医院“种子计划”人才项目、先进个人、优秀授课教师等。研究方向:消化道早期肿瘤的内镜微创诊治和胃肠胰神经内分泌肿瘤。

审核:施海韵

图片-7.jpg

首都医科大学附属北京友谊医院消化内科副主任医师,副教授,青年博导。北京医学会消化病学分会肠道疾病专业副召集人,北京医学会消化病学分会青年论坛副召集人。入选北京市优秀青年人才、北京市科技新星计划等多项人才计划。主持国家自然科学基金、首都临床特色应用研究等多项科研课题。在国际、国内学术期刊发表论文30余篇,多次在DDW、APDW等国际国内学术会议做汇报交流并获青年研究者奖。主要研究方向:炎症性肠病、结直肠肿瘤与肠道微生态。

总审核:张澍田

图片-8.jpg

首都医科大学附属北京友谊医院院长,消化健康全国重点实验室主任,国家消化系统疾病临床医学研究中心主任,国家临床医学协同研究创新联盟秘书长,中国医院协会第三、四届副会长,中华医学会消化内镜学分会第七届主任委员,中华医学会消化病学分会第九届副主任委员,北京医学会消化内镜学分会第六届主任委员,北京医学会消化病学分会第十届主任委员,中国医师协会消化医师分会第四、五届会长,亚太消化内镜学会第六、七届委员,世界华人消化医师协会第一届会长,中华消化内镜杂志主编,中华消化杂志副主编,中华医学杂志(英文版)副主编。

首都医科大学附属北京友谊医院消化中心简介

QQ20260324-173051.jpg

首都医科大学附属北京友谊医院消化中心以食管、胃肠及肝胆胰腺疾病的内镜介入(微微创)诊断与治疗为特色,国内领先、国际知名。是消化健康全国重点实验室、消化系统疾病国家临床医学研究中心、国家重点临床专科、北京市消化疾病中心。由消化一、二、三科、消化内镜中心(全球20家最卓越之一)、消化实验室和消化六科组成。目前职工总人数329人:医生106人,护理151人,科研人员32人,工程师1人,医辅人员39人;在读研究生99人。现有病床150张,消化内镜中心总面积5400平方米,共有46个操作台,其中ERCP6台。实验室总面积6000平方米。

西城院区:位于首都核心区(前门南、天坛西)

通州院区:位于北京城市副中心

顺义院区:位于首都机场附近的后沙峪