智算多多



研究人员提出了首个面向乳腺超声影像分析的基础生成模型 BUSGen,该模型在超过350万张乳腺超声图像上进行预训练,学习了丰富的乳腺解剖结构、病理特征以及临床变异模式。
通过少样本适配,BUSGen能够生成高质量、任务特异的合成数据,从而支持多种下游任务模型的构建,包括乳腺癌筛查、早期诊断以及预后预测。实验结果表明,基于生成数据训练的模型在多个任务上显著优于传统基于真实数据训练的基础模型。在乳腺癌早期诊断任务中,该方法甚至超过了多名经验丰富的放射科医生,平均灵敏度提升达到16.5%。此外,研究人员还系统分析了生成数据的扩展效应,并证明该模型在隐私保护和数据共享方面具有重要优势。整体而言,该研究展示了生成式基础模型在医学影像领域的巨大潜力,为乳腺癌精准诊断提供了新的技术路径。
乳腺癌是全球女性中最常见的恶性肿瘤之一,对公共健康构成严重威胁。超声成像因其无创性、便捷性以及对致密乳腺的高敏感性,成为乳腺癌筛查的重要工具。
然而,乳腺超声图像的解读具有高度复杂性。一方面,乳腺组织结构复杂,病变表现细微;另一方面,不同患者之间以及不同设备之间存在显著差异。这些因素使得即便是经验丰富的临床医生,也可能在图像解读中出现误判,从而影响早期诊断与治疗决策。
尽管深度学习在胸部X光、病理图像和视网膜影像等领域取得了显著进展,但乳腺超声分析仍然发展相对缓慢。其核心瓶颈在于高质量标注数据的缺乏,这主要源于隐私保护和数据共享的限制。
在这一背景下,人工智能研究正逐步从任务特定模型转向基础模型范式,通过大规模预训练实现跨任务泛化能力。研究人员认为,构建一个能够生成高质量数据的基础模型,是推动乳腺超声智能分析的关键一步。
研究人员提出的BUSGen框架由两个核心阶段组成:大规模预训练与下游任务适配。
在预训练阶段,研究人员构建了一个包含350万级别乳腺超声图像的数据集,覆盖不同年龄、病理类型以及设备来源。数据由临床专家标注,包括病理类别、病灶位置以及设备信息等,为模型学习提供了高质量监督信号。
模型采用扩散生成框架,通过逐步去噪过程学习图像分布,从而能够生成具有真实结构和语义的超声图像。为了捕捉细粒度结构信息,模型直接在像素空间进行训练,并通过条件生成机制引入多种临床标签信息。
在适配阶段,研究人员冻结预训练模型参数,仅通过轻量级适配模块进行微调,从而在少样本条件下生成多样化且高质量的任务特异数据。这些数据进一步用于训练下游模型,实现从数据生成到任务建模的闭环。
研究人员首先展示了BUSGen的整体框架及其预训练与适配流程。模型通过大规模数据学习乳腺影像分布,并在适配阶段生成无限量的任务特异数据。
实验结果表明,基于BUSGen生成数据训练的模型在筛查、诊断和预后等多个任务中均显著优于基线模型。这说明生成模型不仅能够学习数据分布,还能够有效支持下游任务建模。
研究人员通过视觉图灵测试评估生成图像质量。结果显示,放射科医生几乎无法区分生成图像与真实图像,说明模型能够生成具有高度真实感的医学影像。
同时,通过相似性分析发现,生成图像并不会简单复制训练数据,从而有效降低隐私泄露风险。这为医学数据共享提供了新的解决思路。
在筛查任务中,BUSGen显著提升了对小病灶的检测能力。由于小病灶通常难以被发现,这一能力对于早期筛查尤为关键。
此外,在无症状人群的机会性筛查中,模型在良恶性分类任务中表现出更高的准确性,说明其能够辅助临床分诊决策,提高筛查效率与准确性。
在乳腺癌早期诊断任务中,研究人员重点分析了导管原位癌(DCIS)的识别能力。该类型癌症在影像上与良性病变相似,传统诊断难度较大。
实验结果表明,即使在极少样本条件下,BUSGen仍能显著提升诊断性能,并超过经验丰富的临床医生。同时,当生成数据规模扩大时,模型性能持续提升,且可达到甚至超过基于真实大规模数据训练的模型。
此外,生成数据还有效缓解了由设备差异等因素带来的偏差问题,从而提升模型的泛化能力。
研究人员进一步将BUSGen应用于预后相关任务,包括分子亚型预测和淋巴结转移预测。
结果表明,模型在这些任务中显著优于基线方法,并能够通过特征空间聚类清晰区分不同类别。同时,通过可视化分析,模型在预测过程中关注的区域具有明确的医学意义,例如病灶边缘或周围组织区域。
这些结果说明,BUSGen不仅具有较强预测能力,还具备一定的可解释性,有助于提升临床信任度。
该研究提出了首个面向乳腺超声影像分析的基础生成模型,实现了从数据生成到多任务分析的统一框架。
其核心贡献在于:
这一工作标志着医学影像AI从“依赖数据”向“生成数据驱动”转变,为未来精准医疗提供了重要技术基础。