中心公告
《胃肠病学》前沿速递——第60期:GastroNet-5M:一个用于开发消化内镜基础模型的多中心数据集
引言
《胃肠病学》(Gastroenterology)是美国胃肠病学会(American Gastroenterology Association,AGA)的官方杂志,是国际消化病学领域的顶级学术期刊,提供了胃肠病学基础和临床研究的最新和权威报道。首都医科大学附属北京友谊医院是消化系统疾病国家临床医学研究中心和消化健康全国重点实验室依托单位,是AGA在中国唯一官方指定授权发布《胃肠病学》杂志翻译的单位。
每月两期,一起了解胃肠疾病学术前沿信息!


第60期

GastroNet-5M:一个用于开发消化内镜基础模型的多中心数据集
通讯作者:
Jacques J. G. H. M. Bergman,荷兰阿姆斯特丹大学医学中心
背景与目的
内镜领域深度学习系统的训练通常需要大量带注释的图像数据集,但这类数据集往往稀缺且获取成本高昂。基础模型通过大规模、多样化数据集进行预训练,仅需少量额外微调即可应用于多种任务。然而,内镜领域缺乏用于开发此类基础模型的通用内镜图像数据集。本研究旨在呈现GastroNet-5M数据集,该数据集包含约50万例内镜检查中的4,820,653张内镜图像。
方法
GastroNet-5M由2012年至2020年间荷兰8家医院采集的匿名化普通内镜图像组成。研究采用自监督学习方法,基于该数据集开发基础模型,并将其与现有公开内镜基础模型及最先进的非基础模型,在17项消化内镜人工智能应用中进行对比。评价指标包括分类诊断与图像分割准确率、数据效率及在异质性数据中的稳健性。
结果
GastroNet-5M预训练模型在几乎所有分类诊断和图像分割任务中的准确率均优于其他所有模型。此外,该模型在获得理想性能时所需的应用特定训练数据量显著减少,且在面对来自不同内镜制造商的图像等数据异质性时表现更稳健。
结论
使用GastroNet-5M对内镜深度学习系统进行预训练可提高诊断准确性,减少对稀缺应用特异性内镜图像及标注的需求,并增强模型对临床不可避免的异质性数据的稳健性,有望显著加速内镜人工智能系统的开发与应用。GastroNet-5M数据集已公开供科研使用。

图文摘要
研究亮点和启示
本研究针对消化内镜领域深度学习模型训练缺乏大规模通用数据集的问题,提出了包含近500万张内镜图像(源自约50万例内镜检查)的多中心数据集GastroNet-5M。该数据集由荷兰8家医院2012-2020年采集的内镜图像组成,涵盖胃镜、肠镜和胶囊内镜检查,经匿名化、数据清理与预处理后公开。研究基于自监督学习框架DINOv2开发基础模型,在17项内镜人工智能任务(含9项分类诊断任务、9项图像分割任务)中,与3个公开内镜基础模型及5个最先进的非基础模型进行对比。结果显示,GastroNet-5M预训练模型在分类诊断准确率(如结直肠息肉表征AUC达85%、胃癌浸润深度评估AUC达95%)、图像分割精度(如结直肠息肉分割Dice系数达90%)、数据效率(仅需25%训练数据即可达到其他模型100%数据的性能)及对异质性数据的稳健性(适配不同厂家内镜设备、图像质量及成像技术)方面均显著优于对比模型。
本研究的主要亮点:
1. 数据集规模与多样性优势显著:GastroNet-5M包含近500万张内镜图像,覆盖8家医院、3大主流内镜制造商设备及全胃肠道检查类型,是目前公开的大规模内镜专用数据集,填补了领域空白。
2. 性能全面超越现有模型:在分类诊断(如结肠息肉、胃癌浸润深度)、图像分割(如勾勒血管发育不良、巴雷特瘤变和结肠息肉边界)等核心任务中,GastroNet-5M预训练模型的准确率、分割相似度均显著优于现有模型,部分任务性能提升幅度达7%-17%。
3. 数据效率大幅提升:仅需5%-25%的标注训练数据即可达到其他模型使用100%数据的性能,有效解决内镜领域标注数据稀缺、标注成本高的核心痛点。
4. 稳健性适配临床实际场景:对不同内镜制造商设备、内镜型号、成像技术及图像质量的适配性强,降低了临床应用中 “领域偏移” 导致的性能下降风险。
5. 开源共享推动领域发展:GastroNet-5M数据集公开供科研使用,为全球研究者提供统一的预训练基础,助力内镜人工智能模型的可重复性研究与标准化发展。
本研究对消化内镜人工智能领域的启示:
1. 技术层面:(1)领域专用预训练是医疗人工智能的重要发展方向,相较于通用图像数据集(如 ImageNet),基于消化内镜场景特定数据的预训练能更好捕捉领域相关特征,提升模型性能与泛化能力。(2)自监督学习在无标注医疗数据中的应用潜力巨大,可充分利用海量临床未标注数据,降低对人工标注的依赖,为医疗人工智能的规模化发展提供新思路。
2. 临床层面:(1)高数据效率与强稳健性的模型更易适配不同层级医疗机构的设备与成像条件,加速人工智能技术向临床实践转化,尤其有助于提升早期癌前病变的检出率与诊断准确性。(2)单中心预训练模型虽性能不及多中心模型,但仍优于现有基准模型,为缺乏多中心数据资源的机构提供了务实的模型开发路径。
3. 科研层面:(1)未来可通过添加弱标注、构建标注子集等方式扩展GastroNet-5M的应用场景,支持有监督预训练、视觉语言模型开发等更多研究方向。(2)需进一步扩大数据集的地理多样性与设备覆盖范围(如纳入最新内镜系统),减少潜在偏倚,提升模型的全球适用性。
GastroNet-5M数据集的公开可用性为胃肠道内镜领域的基础模型研究提供了重要支撑,推动该领域人工智能系统的高效开发与临床转化。
译者简介
译者:范宇晖

医学博士,首都医科大学附属北京友谊医院消化内科医师。主持北京市自然科学基金青年项目、友谊医院种子计划等课题,近年以一作发表多篇SCI论文,研究方向:肝癌及肝纤维化的分子机制及靶点研究,医疗数据大模型及人工智能医工结合。参与多项国家自然科学基金面上项目、青年项目,获批国家专利7项,北京市副中心青年后备人才。
审核:施海韵

医学博士,首都医科大学附属北京友谊医院消化内科主任医师,副教授,青年博导。中华医学会消化病学分会胃肠微生态学组委员,中华医学会消化内镜学分会小肠镜和胶囊镜学组委员,北京整合医学学会炎症性肠病分会副主任委员,北京医学会消化病学分会肠道疾病专业副召集人,北京医学会消化病学分会青年论坛副召集人。入选北京市优秀青年人才、北京市科技新星计划等多项人才计划。主持国家自然科学基金、首都临床特色应用研究等多项科研课题。在国际、国内学术期刊发表论文30余篇,多次在DDW、APDW等国际国内学术会议做汇报交流并获青年研究者奖。主要研究方向:炎症性肠病、结直肠肿瘤与肠道微生态。
总审核:张澍田

首都医科大学附属北京友谊医院院长,消化健康全国重点实验室主任,消化系统疾病国家临床医学研究中心主任,国家临床医学协同研究创新联盟秘书长,中国医院协会第三、四届副会长,中华医学会消化内镜学分会第七届主任委员,中华医学会消化病学分会第九届副主任委员,北京医学会消化内镜学分会第六届主任委员,北京医学会消化病学分会第十届主任委员,中国医师协会消化医师分会第四、五届会长,亚太消化内镜学会第六、七届委员,世界华人消化医师协会第一届会长,中华消化内镜杂志主编,中华消化杂志副主编,中华医学杂志(英文版)副主编。
首都医科大学附属北京友谊医院消化中心简介

首都医科大学附属北京友谊医院消化中心以食管、胃肠及肝胆胰腺疾病的内镜介入(微微创)诊断与治疗为特色,国内领先、国际知名。是消化健康全国重点实验室、消化系统疾病国家临床医学研究中心、国家重点临床专科、北京市消化疾病中心。由消化一、二、三科、消化内镜中心(全球20家最卓越之一)、消化实验室和消化六科组成。目前职工总人数329人:医生106人,护理151人,科研人员32人,工程师1人,医辅人员39人;在读研究生99人。现有病床150张,消化内镜中心总面积5400平方米,共有46个操作台,其中ERCP6台。实验室总面积6000平方米。
西城院区:位于首都核心区(前门南、天坛西)
通州院区:位于北京城市副中心
顺义院区:位于首都机场附近的后沙峪


