神经影像,尤其是磁共振成像(MRI),以其安全、无创、高分辨率的优势,在脑科学和脑疾病的基础研究和临床应用中发挥着重要作用。精准量化的影像学指标需要经由复杂精密的预处理获得,而当前主流的处理工具和管线大多由英美等国家的研究团队开发和主导,如哈佛大学的FreeSurfer,伦敦大学学院的SPM,牛津大学的FSL,斯坦福大学的fMRIPrep。其中大部分核心算法开发于20多年前,设计初衷是为小样本服务,其处理速度和计算效率在如今的“大影像数据时代”(图1)逐渐成为瓶颈。另一方面,传统方法难以处理脑卒中、脑肿瘤、脑外伤等情况下的影像数据,也限制了神经影像的进一步临床应用。因此,开发一款计算高效、结果准确、处理稳健的神经影像预处理管线显得尤为重要。
图1.公开可获取的神经影像数据呈指数上升趋势,该领域已迈入大数据时代
为应对当前挑战,北京大学生物医学前沿创新中心、昌平实验室刘河生课题组开发了一款高效、精准、处理稳健的神经影像数据预处理管线DeepPrep。该项成果于2025年2月6日在Nature Methods在线发表。DeepPrep基于多项先进的深度学习算法和动态工作流管理器,实现了对结构MRI与功能MRI的神经影像精准预处理。得益于深度学习技术和动态资源调度的加持,DeepPrep相较于国际先进水平管线实现了处理速度的10倍提升,并且针对临床复杂样本的处理稳健性也大幅提升。这些优势使得DeepPrep有望成为一项在大数据时代和临床转化应用中不可或缺的神经影像预处理基础设施。
01. DeepPrep——深度学习赋能的神经影像预处理管线
图2.DeepPrep影像预处理流程图
刘河生课题组在利用深度学习优化神经影像数据处理的领域深耕多年,先后开发出了功能影像重建的深度学习方法(Yan, Dahmani, Ren et al., Nature Communications, 2019)、快速皮层重建算法FastCSR (Ren, Hu, Wang, et al., Brain Informatics, 2022)、快速皮层配准算法SUGAR(Ren, An, et al., Medical Image Analysis, 2024)。DeepPrep的一大核心亮点就是通过集成这些国际领先的深度学习算法取代传统管线中耗时最长的步骤,包括脑组织分割、皮层重建、皮层配准和体积空间配准(图2),从而大幅缩减了运行时间和资源消耗。以皮层配准为例,DeepPrep可以将传统的方法所需的30多分钟压缩到0.02秒。
图3. 工作流管理器
团队将流程中的步骤拆分成了80多个低耦合的子模块,更有利于并行运算。根据每个模块的依赖情况和资源消耗,DeepPrep采用的工作流管理器Nextflow可以进行动态资源调度和并行化,保证了模块间的高效协同,最大化了计算资源利用。这种动态资源调度优于传统管线惯用的提前分配固定资源模式,避免了大量计算资源的闲置浪费(图3)。
02. 速度十倍提升,结果更加稳健
为了验证 DeepPrep 的性能,团队对来自七个数据集的超 55,000 例次扫描进行了全面评估。评估指标包括了计算效率、准确性、信噪比和可重复性等多个方面,并和国际领先的处理管线fMRIPrep进行了比较。
图4.DeepPrep的计算效率大幅提升
无论是单数据的串行处理还是多数据的批量处理,DeepPrep的处理速度相较于fMRIPrep提升超过10倍,单个被试处理仅需30分钟左右,而在一台工作站下批量处理平均仅需8.8分钟/例(图4a&b)。在超算集群上DeepPrep成本最低仅需fMRIPrep 的5%(图4c)。而且DeepPrep的处理结果的准确性和稳定性均达到甚至超越了fMRIPrep的水平。
图5. DeepPrep在临床复杂样本中的处理成功率和准确性更高(左),三个典型错误类型的数据都可以被DeepPrep成功处理(右)
为了检验DeepPrep的稳健性,团队挑选出了 53 个复杂样本(存在脑损伤导致传统算法处理困难的样本)。DeepPrep 完成率为 100.0%,预处理结果准确率为 58.5%,平均处理时间仅 27.4 分钟,显著优于 fMRIPrep(完成率 69.8%,准确率 30.2%,平均处理时间 369.6 分钟)。
因此,DeepPrep相较于国际先进水平不仅实现了10倍计算效率的提升,还在复杂的临床病例处理中表现出了显著优势。
03. 用户友好的预处理工具
为了更好地服务用户,在最新的DeepPrep版本(v25.1.0)推出了用户友好的图形交互界面(GUI),并支持Windows和Linux两大主流操作系统,让没有编程背景的研究人员也能轻松使用。DeepPrep被封装在Docker或Singularity容器中,并支持灵活部署于多种计算环境,包括本地计算机、高性能计算和云计算环境。此外,DeepPrep兼容BIDS格式数据,自动根据输入数据配置预处理流程,无需人工干预,并且处理结果也使用标准BIDS格式进行存储,提高了流程的自动化和标准化水平。最后, DeepPrep还会输出详细的可视化质量检测报告,通过可视化数据结果帮助研究人员轻松评估数据质量和处理结果。
北京大学生物医学前沿创新中心、昌平实验室刘河生教授与任建勋博士为该论文的共同通讯作者,任建勋与工程师安宁为该论文的并列第一作者。实验室蔺聪、张佑嘉、孙震宇、张维、李诗怡、郭宁、崔渭刚、胡清宇、王聃红、华山医院吴学海、天坛医院江涛与王引言以及UPenn的Theodore D. Satterthwaite亦对本文有重要贡献。该研究得到昌平国家实验室、中国博士后科学基金会以及国家自然科学基金的支持和资助。
原文链接:https://www.nature.com/articles/s41592-025-02599-1
新闻稿链接:https://mp.weixin.qq.com/s/nHFwP26HAGGi0b28xT1eJw